タグ

hidehiro-nakataniとanalyticsに関するnabinnoのブックマーク (1)

  • 第21回(最終回) 機械学習 はじめよう | gihyo.jp

    連載第1回が掲載された2010年の6月から、休み休みながらも足かけ3年続いてきたこの『機械学習 はじめよう』も今回が最終回です。 21回にわたる連載の最後を飾る今回は、ここまでの流れの中では触れられなかった「機械学習で実用的なアプリケーションを作るときに気をつけたいこと」を中心にいくつかまとめます。 未知のデータへの対応能力 第9回で「過学習」について少し紹介しました。簡単に復習すると、「⁠過学習」とはモデルが「訓練データさえ正解になればいい」と状態になってしまうことで、未知のデータ(訓練データに含まれない、モデルが知らないデータ)に対する結果がデタラメになりがちという困った特徴があります。 しかも都合の悪いことに、モデルの表現力が高い(パラメータが多く、色々な分布を表すことができる)ほど過学習になりやすいことがわかっています。 そんな困った過学習を防ぐ方法の1つは、期待した答えのみが得ら

    第21回(最終回) 機械学習 はじめよう | gihyo.jp
  • 1