タグ

ブックマーク / okumuralab.org/~okumura (9)

  • ROC曲線

    試験の点数から○○大学に合格(T)か不合格(F)かを予測したいときや,検査値から病気(T)か健康(F)かを判断したいときなどがあります。要するに,与えられた値から,真(TRUE)か偽(FALSE)かを判断したいわけです。 例として右の表のような場合を考えましょう。 与えられた値をどこで切っても,TとFは完全には分離できません。例えば11で切って,11以上を陽性(positive),11未満を陰性(negative)とした場合,10個のTのうち5個がpositiveに入りますので,true positive(真陽性)の割合は0.5です。また,5個のFのうち1個がpositiveに入りますので,false positive(偽陽性)の割合は0.2です。そこで,(0.2, 0.5) をプロットします。このように,区切る値(閾値,カットオフポイント)をいろいろ変えて,横軸にfalse positi

  • ポアソン分布

    「ランダムに事象が起きる」という考え方 次の図は1200秒間に初代ポケットガイガー(PINフォトダイオードを使った放射線計)が放射線をカウントした時刻を示したものです。下は机の上にそのまま置いた場合(全部で17カウント),上はやさしお(カリウムを多く含む塩)の上に置いた場合(全部で38カウント)です。 par(mgp=c(2,0.8,0)) plot(c(0,1200), c(0,3), type="n", axes=FALSE, xlab="", ylab="") axis(1) x1 = c(55,81.5,178.1,194.4,214.3,254.3,517.8,548.7, 553.6,556.6,700.1,730.7,735.6,881.9,883.3,962.2,1164.2) x2 = c(43.9,54.8,85,94.3,115.2,224.5,228.5,246.1

  • Webで数式をもっと簡単に使う方法 | Okumura's Blog

    Webで数式を書く方法,Webで数式を簡単に使う方法に次いで,さらに方法を教えていただいた。 CodeCogsはGoogleAPIに似ているが解像度も指定できる(デフォルト110dpi)。例えば <img src="http://www.codecogs.com/gif.latex?\200dpi x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}" alt="" /> は のようになる。ほかにWYSIWYGのオンライン数式エディタとか,TeX風に書くとimgタグに翻訳してくれるJavaScriptプログラムとか,いろいろ便利なものが提供されている。 手書き数式記号をTeXに直す Detexify LaTeX handwritten symbol recognition というサイトも教えていただいた。

  • 「アメリカ心理学会では統計的有意度は廃止されたそうです」 | Okumura's Blog

    という驚くべき内容の書き込みが群馬大学の青木繁伸先生の掲示板にあるのを見つけた。1999年の書き込みで,ソースは「又聞き」だそうである。もちろん統計的検定が廃止されたという事実はない。以下に少し書くように,いろいろな議論があることは確かであるが,伝言ゲームで「廃止された」という極端な話になるのは,メディアリテラシー(?)の題材としておもしろい。 統計の誤用については,あちこちで議論があり,なかには統計的仮説検定を「廃止」しようというような極端な主張もあることは確かである。そこで,アメリカ心理学会の The APA Board of Scientific Affairs: Task Force on Statistical Inference では,このことを議論し,1996年の Initial reportPDF)に続いて,1999年に最終レポート Statistical methods

  • ブードゥー相関 | Okumura's Blog

    Voodoo Correlations in Social Neuroscience という題の論文が,出版される前からネットで話題になっていた。Nature などでも取り上げられた。「Voodoo correlations」で検索すれば山ほど出てくる。結局,この挑発的な題名は Puzzlingly High Correlations in fMRI Studies of Emotion, Personality, and Social Cognition に改められて,Perspectives in Psychological Science, Volume 4, Issue 3 (May 2009) に掲載された。エディタのコメントと,6のコメント,そのコメント返しも付いて,まるで Voodle 特集号だ。三重大学はこのジャーナルを購読しているので全部ダウンロードできた。購読していな

  • 対話型プロット | Okumura's Blog

    RやAsymptoteやAdobe Illustratorでいろいろグラフを描いているが,最終産物がスタティックな図になってしまうのはおもしろくない。Rなら identify() などを使えばクリックした点の情報がわかる対話型のプロットができる(例)が,Webに載せる段階で固定されてしまう。それではおもしろくないので,JavaScriptで簡単な対話型プロットを作ってみた。 これはJavaScriptHTML 5の canvas 要素を使っている。これについては少し前に グラフを描く(canvas編) という短い解説を書き,昨年度の卒業生の一人が卒研でこの技術を使って子どもに幾何学を教えるツールを作った。他の例としては Blob Sallad という物理シミュレーションがおもしろい(作者による解説)。 おもしろい応用があったら教えてください。

  • gzipの代わりにxzを使おう | Okumura's Blog

    GNU coreutils をソースからコンパイルしようとしてびっくり。coreutils-7.3.tar.gz (9690396バイト) 以外に coreutils-7.3.tar.xz (4045980バイト) が置いてある。*.xz は *.gz の42%のサイズしかない。 7-Zip で使われているアルゴリズム LZMA が gzip 相当の圧縮ツール xz として実装されたのだ。 これからは gzip と打つ代わりに xz と打とう。キーストローク数が半減するだけでなく,ディスク資源が半減し,地球温暖化も半減する。

  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

  • データ視覚化サイトの日本語版があったらいいな | Okumura's Blog

    生徒・学生にグラフの描き方を教えるのにまず使うのは Excel だろう。しかしこの Excel というソフト,チャートジャンクの発生源だ。もっとましなものはないのか。私は昔は gnuplot を使っていたが,最近は統計計算を含めて R を使っている。凝ったものなら Asymptote(→ ベクトルグラフィック言語Asymptoteで日語が通る!)で描けばよい。でも学生に教えるのはたいへん。 そこで登場するのが,以前 ロシア総選挙の不正を示唆するグラフ で紹介した Swivel などのデータ視覚化サイトだ。日語はあまりうまく通らないようだが,日にもよく使っているかたがおられる。 Inside Swivel: Graphing によれば,Ruby の Gruff や,R,gnuplot も検討したが,結局 ploticus + Ruby に落ち着いたとのこと。 このようなデータ視覚化・グ

  • 1