ブックマーク / okumuralab.org/~okumura (2)

  • データは自動処理可能な形で提供してほしい | Okumura's Blog

    今回の大震災に伴う原発事故であちこちで放射線の強度が公開されているが,多くはPDF形式で,数値が取り出しにくく,ひどいものは印刷してからスキャンした画像PDFである。いくつか重要なものはExcel/CSV化してとりあえず http://oku.edu.mie-u.ac.jp/~okumura/stat/data/ で公開しているが,もともと機械可読(自動処理可能)な形で提供してほしい。しかも,時間をかけてワープロできれいに罫線を引いて手打ちするのではなく,測定値を実時間で提供する仕組みを作ってほしい。なお,このようなデータ提供のセンスも情報リテラシー教育の一つとして学校で教えてほしい。 一番重要なデータは東京電力が提供する福島第一・第二原子力発電所のモニタリングの結果である。以前はプレスリリースからたどるのがわかりやすかったのでこのページをチェックしていたが,「3月18日福島第二原子力発電

    nanoha3
    nanoha3 2011/03/20
    データ分析は、分析方法検討が10%、データクレンジングが80%、データ処理が10%になることが普通だからなー
  • 『数学で犯罪を解決する』 | Okumura's Blog

    数学で犯罪を解決する』というが県立図書館にあったので借りてきた。米国のTVドラマ NUMB3RS を解説する形での,数学(特に確率・統計)の啓蒙書である。巻末に訳者の山形浩生さんによる解説があり,それ自身たいへんおもしろい読み物になっているが,専門的な部分はあまり信じないほうがいい。 このブログの一つ前の 足利事件当時のDNA鑑定の精度は? にも関係するDNAプロファイリングの話もある。容疑者のDNA型が一致する場合と,DNAデータベースを探して同じ型が見つかる場合(コールド・ヒット)とでは,確率の捉え方を変えなければならないことも書かれている。なお,ここではヒットの確率を10兆分の1と評価している。 Chapter 12「裁判所の数学」もおもしろい。ここで扱っている People v. Collins の裁判は,訴追者の誤謬(Prosecutor's fallacy)の古典的な例とし

    nanoha3
    nanoha3 2009/09/13
    NUM3ERSのほんの話。前読んだけど、非常に面白かった。数学がきちんと使われていたか、正確に使われていたかは別。
  • 1