エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
機械学習でデータ不均衡を解消する:ダウンサンプリングの利用 - Qiita
こんにちは、機械学習を学んでいる皆さん!今日は、データの不均衡という一般的な問題と、それに対する... こんにちは、機械学習を学んでいる皆さん!今日は、データの不均衡という一般的な問題と、それに対する解決策の一つであるダウンサンプリングについて解説します。 不均衡データとは何か? 機械学習のデータセットでは、時々クラス(カテゴリ)間でサンプル数に大きな偏りがある、いわゆる「クラス不均衡」の問題に直面します。たとえば、クレジットカードの不正利用検出のような問題では、正例(不正利用)は極めて少なく、負例(正当な取引)が圧倒的に多いといった状況があります。このような不均衡があると、多数派のクラスを予測することで高い正解率を得られるため、モデルは少数派のクラスを適切に学習・予測できない場合があります。 ダウンサンプリングとは何か? この問題を解決するための一つのアプローチが、ダウンサンプリングです。ダウンサンプリングとは、多数派のクラスのサンプル数をランダムに削減し、少数派のクラスとの比率を均等にす
2023/06/08 リンク