タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

pythonと統計に関するshowyouのブックマーク (2)

  • Python: 特徴量の重要度を Permutation Importance で計測する - CUBE SUGAR CONTAINER

    学習させた機械学習モデルにおいて、どの特徴量がどれくらい性能に寄与しているのかを知りたい場合がある。 すごく効く特徴があれば、それについてもっと深掘りしたいし、あるいは全く効かないものがあるなら取り除くことも考えられる。 使うフレームワークやモデルによっては特徴量の重要度を確認するための API が用意されていることもあるけど、そんなに多くはない。 そこで、今回はモデルやフレームワークに依存しない特徴量の重要度を計測する手法として Permutation Importance という手法を試してみる。 略称として PIMP と呼ばれたりすることもあるようだ。 この手法を知ったのは、以下の Kaggle のノートブックを目にしたのがきっかけだった。 Permutation Importance | Kaggle あんまりちゃんと読めてないけど、論文としては Altmann et al. (2

    Python: 特徴量の重要度を Permutation Importance で計測する - CUBE SUGAR CONTAINER
  • R+Pythonでマルコフ連鎖モンテカルロ - dataminer.me

    バイト先で広告の効果測定を頼まれたので、前々から興味があったMCMCを使って測定を行った。 PythonにはPyMCという専用のパッケージがあるけど、そっちはどうも小難しい感じがしたので Rpyを使って使えるようにしてみた。 使い方はRで回帰分析をするときとほとんど同じでデータフレームと数式を入れると結果を出すという形式にした。 用いたデータは2004年1月〜2009年9月までの円ドルレートとアメリカの失業率。(http://www.mediafire.com/?mfo5mmezow3) MCMCで解析した結果とその際に行われた推定の過程をPDFファイルで吐き出してくれるようにした。 解析した結果はと言うと、失業率と円/ドルはそこまで関係が強くないらしい(回帰分析でR2が0.63くらい) 単変量であたるくらい単純なものだったら、FXで損する人はいないか。 以下、今回用いたソースコード。 #

    R+Pythonでマルコフ連鎖モンテカルロ - dataminer.me
    showyou
    showyou 2009/11/07
    あーそっかRPy使えば統計楽なのか
  • 1