タグ

ブックマーク / okumuralab.org/~okumura (3)

  • ROC曲線

    試験の点数から○○大学に合格(T)か不合格(F)かを予測したいときや,検査値から病気(T)か健康(F)かを判断したいときなどがあります。要するに,与えられた値から,真(TRUE)か偽(FALSE)かを判断したいわけです。 例として右の表のような場合を考えましょう。 与えられた値をどこで切っても,TとFは完全には分離できません。例えば11で切って,11以上を陽性(positive),11未満を陰性(negative)とした場合,10個のTのうち5個がpositiveに入りますので,true positive(真陽性)の割合は0.5です。また,5個のFのうち1個がpositiveに入りますので,false positive(偽陽性)の割合は0.2です。そこで,(0.2, 0.5) をプロットします。このように,区切る値(閾値,カットオフポイント)をいろいろ変えて,横軸にfalse positi

    bob3
    bob3 2011/03/06
    奥村先生によるROC曲線を描くRの関数
  • twitteRたのしいよtwitteR | Okumura's Blog

    楽しすぎる統計・データ解析用言語 R の欠点は,Googleで検索しにくいことである。 そのRに twitteR というTwitter APIを操るパッケージができていた。これまた楽しい! 使い方の例: install.packages("twitteR") library(twitteR) userTimeline("h_okumura") # 例 sess = initSession("h_okumura", "パスワード") tw = tweet("MacのRならtwitteRで化けないのかな", sess) # もし化けたら deleteStatus(tw, sess) する 詳しい使い方はvignetteやreference manualを見ればわかるが,実例がほしい。しかし残念なことに,Google検索ではtwitteRTwitterも同じと扱われてしまう。Twitterで教

  • Elements of Statistical Learning がダウンロードできる! | Okumura's Blog

    Elements of Statistical Learning: data mining, inference, and prediction. 2nd Edition. は便利なだが,重くて持ち歩くのに不便だった。それが丸一冊PDFでダウンロードできるようになっていた! Springerさん,ありがとう! これで出張のときも持って行ける。

    bob3
    bob3 2009/10/22
  • 1