
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
異常検知手法 Isolation Forestの解説、スクラッチでの実装 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
異常検知手法 Isolation Forestの解説、スクラッチでの実装 - Qiita
Isolation Forestとは 異常検知に用いられる手法の一つです。 名前からお察しの通り、Isolation Forest... Isolation Forestとは 異常検知に用いられる手法の一つです。 名前からお察しの通り、Isolation ForestはRandom Forestと同様に決定木に基づいて構築されます。 決定木を各データが孤立するまで分割を繰り返し、データが孤立するまでの距離(深さ)から異常値を推定しよう、というのが基本的なアイディアです(Isolate=孤立)。全データを使って決定木を一つだけ作成すると過学習してしまうので、データをサンプリングした上で、大量の決定木を作成し、作成した決定木の各データが孤立するまでの距離の平均を使用して異常値スコアを算出します。 なお、分割する際の閾値は変数の最大/最小値の範囲からランダムに選択されますが(普通の決定木は情報利得により閾値を決定)、この手順により異常値は早く孤立することが直感的に理解できる例があったのでそのまま記載します。 例えば、IQはだいたい