タグ

rocに関するyukimori_726のブックマーク (4)

  • Machine Learning with Scikit Learn (Part II) - 人工知能に関する断創録

    Machine Learning with Scikit Learn (Part I)(2015/8/10)のつづき。今回は、後編のPartIIの動画の内容を簡単にまとめたい。 4.1 Cross Validation ラベル付きデータが少ないときに有効な評価法であるK-fold cross-validationについての説明。訓練データをK個のサブセットに分割し、そのうち1つのサブセットをテストデータに残りK-1個のサブセットを訓練データにして評価する。これをテストデータを入れ替えながらK回評価し、その平均を求める。 この手順は下のように書ける。bool型のマスクを使ってテストデータと訓練データをわけている。 k = 5 n_samples = len(X) fold_size = n_samples // k scores = [] masks = [] for fold in ran

    Machine Learning with Scikit Learn (Part II) - 人工知能に関する断創録
  • ROC曲線とは何か、アニメーションで理解する。 - Qiita

    統計学、パターン認識等で、ROC(Receiver Operating Characteristic;受信者動作特性)曲線という概念が出てきます。また、データ分析・予測のコンペティションサイトKaggleでも、提出されたアルゴリズムの識別性能評価にこのROC曲線に基づくAUC(Area Under the Curve)というものを使っています。(例えばココ) このROC曲線、ちょっとわかりにくいので、まとめてみました。また、アニメーションでグラフを動かしてイメージを付けるということもやってみます。 1. ROC曲線に至る前説 まず、例として健康に関するとある検査数値データがあったとします。 この検査数値は健康な人は平均25, 標準偏差2の正規分布に従い分布しています。(下記図の緑の曲線) 病気の人は平均30、標準偏差4の正規分布に従い分布しています。(下記の図の青の曲線) グラフにすると下

    ROC曲線とは何か、アニメーションで理解する。 - Qiita
  • ( 頭の整理 )ROC曲線 を 描画(AUC面積 算出)するとき使うのは、分類器 による新規データ の 『クラス帰属確率』の 推定値 の方なので注意。 - Qiita

    Precision-Recall Curve(適合率・再現率曲線)及び ROC Curve (ROC曲線)を 描画(AUC面積 算出)するときに依拠するのは、分類器 による新規データ の 『クラス帰属確率』の 推定値 で、(Python) sklearnモジュール の classification_reportメソッド を用いて、よく出力される 「適合率・再現率」が 依拠する「確定的な」クラス判定結果 ではありません。 学習用データで学習済みの「分類器」を使って、新規データ の クラス分類予測 を 行う際、帰属クラス を 「確定的」(断定的)に 予測 する方法 と、対象データ が 各クラス に帰属する「確率」 を 求める方法 の 2種類のやり方 があり、R言語の関数にも、Python言語 のメソッド(モジュール)にも、双方の形式で予測を行うライブラリ が 用意されています。 上記は、よく混

    ( 頭の整理 )ROC曲線 を 描画(AUC面積 算出)するとき使うのは、分類器 による新規データ の 『クラス帰属確率』の 推定値 の方なので注意。 - Qiita
  • そろそろ本気で機械学習の評価方法について学習するよ - Y's note

    Machine Learning for Hackers 作者: Drew Conway,John Myles White出版社/メーカー: Oreilly & Associates Inc発売日: 2012/02/28メディア: ペーパーバック クリック: 63回この商品を含むブログを見る 機械学習の評価方法について学習 機械学習初心者ですが最近業務で格的に触り始めています。少し前までSmartPhoneのWebAppliを作ることを専門職としていたので機械学習の領域は未知な事が非常に多く、用語の意味ですら十分に理解できていません。今日は機械学習の評価方法を中心に学習(勉強)した内容を記録して行きます。例えばPrecision/Accuracy/Recallの言葉の違いやROC曲線,AUC評価などの技法といったものが話の中心になります。初心者視点で書いていますので専門性がありません。間

    そろそろ本気で機械学習の評価方法について学習するよ - Y's note
  • 1