
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
不均衡データの分類問題 - Qiita
※正例が10件、負例が990件のデータ この分類器は正例データを1件も正例と予測していません。つまり、感... ※正例が10件、負例が990件のデータ この分類器は正例データを1件も正例と予測していません。つまり、感度(正例を正しく正例と判定する確率)は「0%」です。 疾患の有無を判別する検査の例で考えた場合、正答率を高めるために「ほとんどの人は疾患がないので、みんな疾患なし」と判別しているようなものです。もはや、検査の意味がないですね。。 何も工夫しない場合、上記のような問題が起こる可能性が高くなります。 主な対処手法としては、 データ数の調整(オーバーサンプリング・アンダーサンプリング等) 学習時にクラスの重みを調整 に大別されるようです。 両方とも対処方法としては直感的であり理にかなっていると思いました。 詳しいことはこちらのSlideShareに分かりやすく書いていました。 不均衡データのクラス分類 今回は、「学習時のクラスの重みを調整」について簡単な実験をしてみました。 重みの調整 誤差関