yukinoiのブックマーク - はてなブックマーク

Python: 特徴量の重要度を Permutation Importance で計測する - CUBE SUGAR CONTAINER

学習させた機械学習モデルにおいて、どの特徴量がどれくらい性能に寄与しているのかを知りたい場合がある。すごく効く特徴があれば、それについてもっと深掘りしたいし、あるいは全く効かないものがあるなら取り除くことも考えられる。使うフレームワークやモデルによっては特徴量の重要度を確認するための API が用意されていることもあるけど、そんなに多くはない。そこで、今回はモデルやフレームワークに依存しない特徴量の重要度を計測する手法として Permutation Importance という手法を試してみる。略称として PIMP と呼ばれたりすることもあるようだ。この手法を知ったのは、以下の Kaggle のノートブックを目にしたのがきっかけだった。 Permutation Importance | Kaggle あんまりちゃんと読めてないけど、論文としては Altmann et al. (2

yukinoi 2018/11/12

リンク

Python: 自作パッケージにデータファイルを含める - CUBE SUGAR CONTAINER

Python で自作パッケージを作る際に、ソースコード以外のファイルを含めたくなる場合がある。例えば Web アプリケーションを作るときの HTML テンプレートなんかはよくあるパターン。今回は自作パッケージにソースコード以外のファイル (データファイル) を含めるやり方について書いてみる。使用する環境は次の通り。 $ python --version Python 3.5.1 $ pip list pip (7.1.2) setuptools (18.2) wheel (0.24.0) 自作パッケージを用意するデータファイル云々を説明する前に、まずはそれを入れるためのパッケージから作っていこう。今回作成するパッケージは 'mypackage' という名前にする。最初にプロジェクトのディレクトリを用意する。作成するパッケージ名とプロジェクトのディレクトリ名は揃える場合が多い。

yukinoi 2016/04/10

Python

リンク

Python のバージョン毎の違いとその吸収方法について - CUBE SUGAR CONTAINER

この記事の目指すところ現在 Python はバージョン 2.x 系と 3.x 系という、一部に互換性のないふたつのメジャーバージョンが併用されている。その上で、この記事にはふたつの目的がある。ひとつ目は、2.x 系と 3.x 系の違いについてまとめること。現状、それぞれのバージョン毎の違いはまとまっているところが少ない。自分用に、このページだけ見ればひと通り分かる！っていうものがほしかった。ふたつ目は、2.x 系と 3.x 系の違いを吸収するソースコードの書き方についてまとめること。こちらも Web 上にナレッジがあまりまとまっていない。これについては今 python-future というパッケージがアツい。尚、サポートするバージョンは以下の通り。 2.x 系: 2.6 と 2.7 3.x 系: 3.3 と 3.4 本題に入る前に、最近の Python 事情についてまとめ

yukinoi 2015/11/17

python

リンク

はてなブックマーク

タグ

ブックマーク / blog.amedama.jp (3)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス