タグ

ブックマーク / rindai87.hatenablog.jp (2)

  • フィッシャーとベイズを軽く試す - 元データ分析の会社で働いていた人の四方山話

    僕は情報工学を選考してきた学生ではあるが、残念ながら大学の意味不明なカリキュラムにより,統計確率は必修ではないため、学部自体に確率についてまともに勉強する機会がなく、当然の事ながら大学院入試でも統計確率が試験科目としてなかったため、必要になった時につまみい的に統計確率を学ぶ程度で、実は情報系を選考している大学院生であり4月から統計確率バリバリの金融工学な世界に足を踏み入れるのにも関わらず、恐ろしく統計確率の知識が希薄であるというありえない状況である。これはまずいなー、と思っていたところ、証券アナリストの勉強やら何やらで統計確率に触れる時間が増え、読み物的な確率のから学習をしていってるので、適宜アウトプットしていこうと思います。 何か同僚のブログのコメント欄で紹介されていたを買って読んでみています。確率的発想法~数学を日常に活かす NHK出版 2004-02-29 売り上げランキング

  • カーネルのパラメータの重要性 - 元データ分析の会社で働いていた人の四方山話

    SVMをSVMたらしめているカーネルですが落とし穴があります。 カーネルについてよく言われることに、 どのようなカーネルを使うかより、カーネルパラメータをいかに設定するか ということがあります。 カーネルパラメータの設定がすごく重要ということです。 例えばRBFカーネルを用いる場合、適当に決めたパラメータと最適(と思われる)パラメータでは数10パーセント以上の分類精度の差が出ることもあるそうです。 実際僕が使っているデータでもそうみたいですね。 最適なカーネルパラメータの求め方 今のところ、明確にこれ、という方法がなく、試行錯誤的に求めるgrid searchという手法が強力なようです。 grid searchは単純に、指数関数的な感覚でパラメータを設定、実際にいくつかのデータを使用してLeave-One-Out Cross-Validationで分類精度を求め、よい結果の出たパラメータを

    カーネルのパラメータの重要性 - 元データ分析の会社で働いていた人の四方山話
  • 1