タグ

ブックマーク / okumuralab.org/~okumura (46)

  • ポアソン分布

    「ランダムに事象が起きる」という考え方 次の図は1200秒間に初代ポケットガイガー(PINフォトダイオードを使った放射線計)が放射線をカウントした時刻を示したものです。下は机の上にそのまま置いた場合(全部で17カウント),上はやさしお(カリウムを多く含む塩)の上に置いた場合(全部で38カウント)です。 par(mgp=c(2,0.8,0)) plot(c(0,1200), c(0,3), type="n", axes=FALSE, xlab="", ylab="") axis(1) x1 = c(55,81.5,178.1,194.4,214.3,254.3,517.8,548.7, 553.6,556.6,700.1,730.7,735.6,881.9,883.3,962.2,1164.2) x2 = c(43.9,54.8,85,94.3,115.2,224.5,228.5,246.1

    heis101
    heis101 2011/11/04
    「同様に,0回しか起きない場合の λ の95%信頼区間は [0, 3.7] です。」「一度も起きたことのないことは通常の統計学では扱えないという人がいますが,ちゃんと扱えていますよね。」
  • [qa:45465] Re: align環境内の行間について

    heis101
    heis101 2010/11/01
    「%ここのpt値を変更することで数式行間を任意に可変できる。\abovedisplayskip=10.0pt plus 4.0pt minus 6.0pt \belowdisplayskip=10.0pt plus 4.0pt minus 6.0pt 」
  • Wordでまともな文書を作る方法 | Okumura's Blog

    日経パソコン2010-03-08特集1「魅せる文書の勘所」すばらしい。Wordでペラもの作らせるならこういう指導を。ただ文字色をグレーにするのは網掛けになって読みにくくなる場合があるので注意。サンプル文書は日経パソコン Onlineからダウンロードできる。 左は稚拙な例,右は良い例。 この特集記事に相当するは私の知る範囲では次のものくらい(やや古い): Wordでマスターする 使えるビジネス文書 レイアウトの極意 実際に次のはWordで組まれている: Moodle入門 オープンソースで構築するeラーニングシステム 逆にTeXで組まれていてもどうしようもない文書もある。伝えるためのルールを知らなければいくらマクロをハックしても自己満足に終わる。 [2010-03-09追記] 上は昨日Twitterでつぶやいたことのまとめのつもりで書いた。Twitter経由でいくつかお礼をいただき恐縮。

    heis101
    heis101 2010/03/09
  • グラフの描き方

    的な考え方 棒グラフは比例尺度の量を表すのに用い,棒の長さ(面積)が量に比例するように描くのが基。一つだけずば抜けて大きい値があるときに棒の上のほうで省略線を用いることはあるが,下を省略して全体の長さを切り詰めることは好ましくない。例えば気象観測データについては,雨量は比例尺度であるので棒グラフで表してもよいが,気温は(絶対温度でない限り)間隔尺度であり,棒グラフは使えない。 折れ線グラフは,両軸とも間隔尺度以上であるのが基。0点から始める必要はない。特に時系列データについてよく使われる。 円グラフは全体における割合を表すにはよいが,全体との比較ではなく個々の値どうしの比較には棒グラフがよい。いわゆる3次元(3D)円グラフは,錯覚を利用して特定の部分を大きく見せるためのもので,一般には用いない。 円グラフは複数回答のアンケート結果の図示には絶対に用いない。 色分けして凡例を付けるの

    heis101
    heis101 2010/03/07
  • 消すなんてもったいない | Okumura's Blog

    今日の昼前のNHK総合TVによれば,記録メディアがフィルムからテープに変わった一時期の番組が,テープ節約のために上書きされ,残っていないものが多数あり,視聴者が録画したテープを探しているとのこと。埼玉県川口市のNHKアーカイブスには大量のアナログメディアが保管されており,うち約6000は行けば見せてもらえる。どんどんデジタル化してネットで見られるようにしてくれればいいのだが,著作権上そうはいかないのだろう。 URI変えるな,ページ消すなのコメントで教えていただいたが,衆議院TVはアーカイブを過去1年分しか残していない。消してしまうとすれば,もったいない話だ。 行政刷新会議による学校ICT活用推進事業の仕分け結果についてのコメントを某所で文科省に出そうとしているのだが,貧弱な公式ネット中継があっただけで,どこにも録画が残っていない(一部の仕分けについてはダダ漏れ中継もあり,MP3ファイルも

    heis101
    heis101 2009/11/23
    「今日の昼前のNHK総合TVによれば,記録メディアがフィルムからテープに変わった一時期の番組が,テープ節約のために上書きされ,残っていないものが多数あり,視聴者が録画したテープを探しているとのこと。」
  • 閣僚資産:平均かメジアンか | Okumura's Blog

    鳩山内閣閣僚の資産が発表された。毎日新聞に出ている四捨五入された万単位の値をCSVにしてみた: "名","人","家族含む" "鳩山由紀夫首相",144269,144269 "菅直人副総理兼国家戦略担当相",905,2232 "原口一博総務相",914,1220 "千葉景子法相",3523,3523 "岡田克也外相",3273,8641 "藤井裕久財務相",14356,20214 "川端達夫文部科学相",4024,5583 "長昭厚生労働相",0,891 "赤松広隆農相",4864,5934 "直嶋正行経済産業相",3333,3333 "前原誠司国土交通相",741,1441 "小沢鋭仁環境相",2089,4014 "北沢俊美防衛相",309,609 "平野博文官房長官",1195,1875 "中井洽国家公安委員長",1296,1296 "亀井静香金融・郵政担当相",9427,1874

    heis101
    heis101 2009/10/24
    「どちらが適当か。ちなみにいくつかの新聞は平均を載せている。メジアンを載せているものはなさそうだ。」
  • 世論調査のウソを数学で見抜く | Okumura's Blog

    Slashdot の Math Indicates Pollster Is Forging Results からのリンク,特に Strategic Vision Polls Exhibit Unusual Patterns, Possibly Indicating Fraud を少し読んでみた。 世論調査会社 Strategic Vision の調査結果の末位の数字(0〜9)の度数分布は 562, 431, 472, 490, 526, 599, 533, 639, 676, 616 である。一様分布からのずれをχ2検定してみると p 値はほぼ 0 であり,でっちあげの数字である可能性がある。 ところが,2008年の上院や大統領選の世論調査の末位の数字の分布は 560, 563, 619, 620, 672, 673, 644, 642, 652, 609 であり,これも一様分布からかなり

    heis101
    heis101 2009/09/26
    「一様分布からのずれをχ2検定してみると p 値はほぼ 0 であり,でっちあげの数字である可能性がある。」
  • 『数学で犯罪を解決する』 | Okumura's Blog

    数学で犯罪を解決する』というが県立図書館にあったので借りてきた。米国のTVドラマ NUMB3RS を解説する形での,数学(特に確率・統計)の啓蒙書である。巻末に訳者の山形浩生さんによる解説があり,それ自身たいへんおもしろい読み物になっているが,専門的な部分はあまり信じないほうがいい。 このブログの一つ前の 足利事件当時のDNA鑑定の精度は? にも関係するDNAプロファイリングの話もある。容疑者のDNA型が一致する場合と,DNAデータベースを探して同じ型が見つかる場合(コールド・ヒット)とでは,確率の捉え方を変えなければならないことも書かれている。なお,ここではヒットの確率を10兆分の1と評価している。 Chapter 12「裁判所の数学」もおもしろい。ここで扱っている People v. Collins の裁判は,訴追者の誤謬(Prosecutor's fallacy)の古典的な例とし

    heis101
    heis101 2009/09/12
    「巻末に訳者の山形浩生さんによる解説があり,それ自身たいへんおもしろい読み物になっているが,専門的な部分はあまり信じないほうがいい。」
  • 「アメリカ心理学会では統計的有意度は廃止されたそうです」 | Okumura's Blog

    という驚くべき内容の書き込みが群馬大学の青木繁伸先生の掲示板にあるのを見つけた。1999年の書き込みで,ソースは「又聞き」だそうである。もちろん統計的検定が廃止されたという事実はない。以下に少し書くように,いろいろな議論があることは確かであるが,伝言ゲームで「廃止された」という極端な話になるのは,メディアリテラシー(?)の題材としておもしろい。 統計の誤用については,あちこちで議論があり,なかには統計的仮説検定を「廃止」しようというような極端な主張もあることは確かである。そこで,アメリカ心理学会の The APA Board of Scientific Affairs: Task Force on Statistical Inference では,このことを議論し,1996年の Initial reportPDF)に続いて,1999年に最終レポート Statistical methods

    heis101
    heis101 2009/09/12
    「有意か否かだけよりは p 値を報告するほうがよく,さらには信頼区間を報告するほうがいいというような,良い統計学の教科書には必ず書かれていることがうまくまとめられている。」
  • 硬貨投げの理論と実験 | Okumura's Blog

    Schneier のブログ Non-Randomness in Coin Flipping に紹介されている論文 headswithJ.pdf, Index of /~susan/papers を直接見れば,タイムスタンプは2004-10-29。同じものが Index of /~cgates/PERSI/papers にもあり,これはTeXのソースも付いていて,タイムスタンプは2004-09-22。これのジャーナル掲載版 dyn_coin_07.pdf も同所にある。タイムスタンプは2007-05-15。書誌情報は Persi Diaconis, Susan Holmes, and Richard Montgomery, "Dynamical Bias in the Coin Toss", Siam Review Vol.49, No.2, pp.211-235. この第1著者はプロの魔術

    heis101
    heis101 2009/08/25
    「この第1著者はプロの魔術師から数学者に転じた人で,コイン投げの結果などは自由に操れるらしい。」
  • メールフォーマットの互換性のなさには泣かされる | Okumura's Blog

    SSS2009@佐賀でもグループウェアとしてMoodleを使ったのだが,Moodleのフォーラムへの書き込みをデフォルトで全員にメール送信する設定にしていたので,それに返信されるかたが必ず出てくる。通常は /dev/null 送りだが,今回は手で拾い出して該当者に転送する作業をした。 Emacs の Mew で通常通り multipart/mixed でフォワードしたのだが,Outlook で開けないという連絡をいただいた。幸い Outlook Express なら開けたそうである。なんでこうもメールフォーマットには互換性がないのだろう。 関連: winmail.datはやめてほしい またまたメールで悩む format=flowed; delsp=yes Macの作法 24日:Sakaiでメール配送しているサイトから誰も読めないメールが届く。これはSakaiが悪いのだろう。添付ファイルと

    heis101
    heis101 2009/08/24
    「Emacs の Mew で通常通り multipart/mixed でフォワードしたのだが,Outlook で開けないという連絡をいただいた。幸い Outlook Express なら開けたそうである。なんでこうもメールフォーマットには互換性がないのだろう。」
  • ディスプレイに凝ろう | Okumura's Blog

    普段はDTP用というよりWebや論文PDFを読むのに疲れない設定にしている。Macならシステム環境設定→ディスプレイ→カラー→補正で細かく調節できる。ガンマは大きめに。Macでも1.8ではなく少なくともPCの標準の2.2にするほうがギラギラしない。色温度は低めに。D65(Web用6500K)かD50(DTP用5000K)のどちらか用途・好みに応じて。ディスプレイの輝度はできるだけ下げる。それでも明るいなら輝度調節ソフトを入れる(DarkAdaptedの無償版を使っているがほかにもいくつかあるようだ)。ディスプレイに光が映り込まないよう注意する。MacBook用アンチグレアフィルムをMac Storeで売っている(未購入)。 こういったことは基礎からわかる情報リテラシーにも少しだけ書いたが,機械を自分の目・自分の環境に合わせて設定できるということは情報リテラシーの目標の一つではないかと思う。

    heis101
    heis101 2009/08/16
    「機械を自分の目・自分の環境に合わせて設定できるということは情報リテラシーの目標の一つではないかと思う。」
  • URI変えるな,ページ消すな | Okumura's Blog

    探し物をしていて古いリンクをたどったら 総務省|ご案内ページ -掲載期間が終了しています- というページにリダイレクトされてしまった。総務省サイトの掲載期間は原則3年で,パンフレットなどは最新版以外は消しているという。国の貴重な資料は永久保存でいいと思うのだが,なぜ消すのだろう? Webの開祖Tim Berners-Leeは1998年に Cool URIs don't change(神崎さんの訳:クールなURIは変わらない)を書いて,URI(URL)が永続すべきことを説いている。もう10年以上も前のページだが,サイト管理者はぜひ読んでほしい。ここに書いてあるように,何十年も永続させるためにはいろいろな工夫が必要だ。例えば拡張子はその時点での技術を反映する。hoge.html は hoge.cgi や hoge.php や hoge.rb になるかもしれない。そのため,W3Cサイトへの正式な

    heis101
    heis101 2009/08/13
    「Webの開祖Tim Berners-Leeは1998年に Cool URIs don't changeを書いて,URI(URL)が永続すべきことを説いている」「何十年も永続させるためにはいろいろな工夫が必要だ。」
  • 人口の差分と人口増加が合わない | Okumura's Blog

    読売新聞の今日の朝刊にも載っていた人口「自然減」最大…全体では2年連続増というニュース,グラフの省略線を境としてスケールが変わるのはとりあえず置いておいて,2004年の人口と2005年の人口そのものを比べれば20万人ほどの増加であるにもかかわらず,自然増加数は5万人,社会増加数は負の値である。どこかおかしい。 というわけで,総務省の住民基台帳に基づく人口、人口動態及び世帯数の資料2(PDF)をよく調べると,このあたりで計算方法が変わったので人口が急増しているように見えるが,同じ方法で算出したときの増加は45231人に過ぎないということのようだ。 ちょっとコピペしてグラフを描き直してみようと思ったが,総務省の資料2は画像PDFである。きっと学生が安易にコピペしてレポートを書かないように配慮してあるのだろう。

    heis101
    heis101 2009/08/12
    「住民基本台帳に基づく人口、人口動態及び世帯数の資料2をよく調べると,このあたりで計算方法が変わったので人口が急増しているように見えるが,同じ方法で算出したときの増加は45231人に過ぎないということのよう」
  • 「儲かる数式」 | Okumura's Blog

    がっちりマンデー「儲かる数式」,三平方の定理→カーナビ,楕円→結石破砕装置,クロソイド曲線→高速道路・ジェットコースター。道路への利用はプロジェクトXでも出てきたそうで,ウィキペディアのクロソイド曲線の項に三国峠越えの話として書かれていた。Squeak Etoysで簡単に描けることも教えていただいた。来年の授業用にメモメモ。 [追記] Scratch 版 clothoid curve も作っていただいた。目が回る!

    heis101
    heis101 2009/08/10
    「Squeak Etoysで簡単に描けることも教えていただいた。」
  • 偏差値は正規分布を前提としている? | Okumura's Blog

    (点数-平均)/標準偏差×10+50で定義する偏差値は「正規分布でないと使えない」と書いたをよく見かけるが,正規分布でなければ偏差値が使えないのではなく,正規分布でなければ例えば「偏差値40〜60が全体の約68%をカバーする」などと言えないだけであろう。 松原望先生の『わかりやすい統計学 第2版』(丸善,2009年)ではpp.48-52で偏差値が説明されているが,p.52に「なお,正規分布のケースの場合のみ,偏差値を考えるという理論もある.」と1センテンスだけ書かれている。違う考えの人にも配慮した書き方をされている点はさすが大先生だ。

    heis101
    heis101 2009/08/09
    「「なお,正規分布のケースの場合のみ,偏差値を考えるという理論もある.」と1センテンスだけ書かれている。」
  • Nature も楕円グラフ | Okumura's Blog

    県立図書館で Nature を見ていて目に留まった。最近は Nature でも円グラフはイメージ?アート?らしい。doi:10.1038/nature08140, Figure 1.

    heis101
    heis101 2009/08/08
    なぜに?
  • 統計グラフの色 | Okumura's Blog

    時間がないのでメモだけ。 Excel(特に2007より古いもの)の色のセンスは最悪。専用ツールで作画する場合も,ついred,green,blue,yellowのような原色を使ってしまうが,広い面積を原色で塗りつぶすと長く見つめるのが難しくなり,統計グラフには不向き。彩度・明度の調節が必要。参考文献: Ross Ihaka (Rの作者), Colour for Presentation Graphics, DSC 2003 Achim Zeileis, Kurt Hornik and Paul Murrell, Escaping RGBland: Selecting colors for statistical graphics, Computational Statistics & Data Analysis, 53, No.9, 3259-3270 (2009); 著者最終稿PDF Rで

    heis101
    heis101 2009/07/01
    「Excel(特に2007より古いもの)の色のセンスは最悪。専用ツールで作画する場合も,ついred,green,blue,yellowのような原色を使ってしまうが,広い面積を原色で塗りつぶすと長く見つめるのが難しくなり」
  • 和文と欧文の間に半角スペースを入れるか | Okumura's Blog

    Moodleのフォーラムで英単語の前後に空白をという提案がされている。「Moodleは」より「Moodle は」のほうが読みやすいから半角スペースを入れようということである。 もともと和文とプロポーショナル欧文の間には,テキストの段階では何も入れなくても,組版の段階で四分アキ(全角の1/4の幅の空白)を入れる習慣があり,先日出たW3Cの Requirements for Japanese Text Layout(日語組版処理の要件)の3.2.6のdにもそう書いてある。日語のブラウザがこれに対応してくれれば余分のスペースを入れる必要がなくなるのだが。 もっとも,「四分アキ」もだんだん狭くなってきて,最近の雑誌類ではほとんど入れていないように見える。スタイルシートで調節ができるのがベストかも。

    heis101
    heis101 2009/06/30
    「もともと和文とプロポーショナル欧文の間には,テキストの段階では何も入れなくても,組版の段階で四分アキ(全角の1/4の幅の空白)を入れる習慣があり,」
  • イランの選挙不正を統計学で暴く | Okumura's Blog

    でっちあげた数字なら下位桁が十分ランダムでないはずだ。実際ランダムでないという結果が出始めているようだ(Gelmanのブログのこことかこことか参照)。しかし,後者のコメントにもあるように,世界中の統計屋が隠れたパターンを見つけようとした場合,地球規模のBonferroni(多重比較の補正)が必要かもしれない。ちゃんと検証するまでは「統計学がイランの不正を暴いた」という記事を書くのは待ったほうがいい。 [2009-06-23] 続報

    heis101
    heis101 2009/06/23
    「でっちあげた数字なら下位桁が十分ランダムでないはずだ。しかし,世界中の統計屋が隠れたパターンを見つけようとした場合,地球規模のBonferroni(多重比較の補正)が必要かもしれない。」