hyperoptのロジック、使い方、検証結果についてまとめる はじめに 機械学習でモデルを作成する際、hyper-parameterのチューニングが必要になります。 gridサーチで徹底的に調べることができればいいのですが、DNNのようにパラメータ数が多くなると、計算量がとんでもないことになります。 ランダムサーチでパラメータの探索を行えば、計算量を少なくすることは可能ですが、最適なパラメータを見つける確率は低くなります。 そこで、効率よく、良さげなパラメータを探索していく方法に、Sequential Model-based Global Optimization(SMBO)というものがあります。 pythonには、SMBOを利用するためのライブラリであるhyperoptというものがあります(kagglerがよく利用しているらしい・・・)。 hyperoptで検索すると、使い方を説明した記
今日紹介するコードはここにおいてあります。 https://gist.github.com/aflc/6482587 編集距離(levenshtein距離)の計算方法で一番有名なのが動的計画法を使ったもので、これはWikipediaにも載っているお手軽でよく使われているものです。 しかし、この方法は結構時間がかかるので、他にも高速な手法がいくつか提案されています。 NOXさんのブログエントリを読んでいただくのが一番手っ取り早いのですが、ビットパラレル法というのが上手くハマると10倍以上高速です。 ここで紹介されている論文では64文字以上の比較ができないのですが、今回は Heikki Hyyrö, "Explaining and extending the bit-parallel approximate string matching algorithm of Myers", 2001 と
はじめに 本エントリではバンディットアルゴリズムの各手法について,実際のユースケースを想定したシミュレーションを行うことで,それぞれの手法の特徴を把握すること目的とします. バンディットアルゴリズムについて日本語でよく参照されているのは以下のQiitaの投稿でしょうか. http://qiita.com/yuku_t/items/6844aac6008911401b19 また以下の資料では各手法の詳細や特徴,簡単なシミュレーションも紹介されています. http://www.slideshare.net/greenmidori83/ss-28443892 上記の資料の手法の紹介はとてもわかりやすいので本エントリでは手法の紹介は特にしません. 想定するユースケース あなたは今1万回表示されてクリック率が1.2%出ている広告を1クリック60円で運用しています. もっとクリックされる広告を見つける
1月12 Pyomo:数理最適化モジュール カテゴリ:分析技術 数理最適化モジュールPyomoの環境構築メモとチュートリアル事例の紹介。 ■Pyomo ドキュメント:https://software.sandia.gov/trac/coopr/wiki/Documentation ダウンロード:https://software.sandia.gov/trac/coopr/downloader/ ■インストール 環境:Max OS X ver10.7.5 ダウンロード:unix版をダウンロード インストール:解凍フォルダのなかの..scr/coore/setup.pyを実行(python setup.py install) ※上記の実行でその他のサブフォルダも一括インストールされた その他:GLPK(数理最適化のソルバー)のインストール(参考) ■ConcreteModelの記述例 以
LAMP is a code for multiple testing correction. Given the relationships between transcription factors (TFs) and genes and gene expression levels, the code lists up statistically significant combinations of TFs. The LAMP algorithm calibrates the Family-Wise Error Rate (FWER) at the same level of Bonferroni correction. Applying our method to your data instead of using the Bonferroni correction gives
2010年は、パターン認識と機械学習(PRML)を読破して、機械学習の基礎理論とさまざまなアルゴリズムを身につけるという目標(2010/1/1)をたてています。もうすでに2010年も半分以上過ぎてしまいましたが、ここらでまとめたページを作っておこうと思います。ただ漫然と読んでると理解できてるかいまいち不安なので、Python(2006/12/10)というプログラミング言語で例を実装しながら読み進めています。Pythonの数値計算ライブラリScipy、Numpyとグラフ描画ライブラリのmatplotlibを主に使ってコーディングしています。実用的なコードでないかもしれませんが、ご参考まで。 PRMLのPython実装 PRML読書中(2010/3/26) 多項式曲線フィッティング(2010/3/27) 最尤推定、MAP推定、ベイズ推定(2010/4/4) 分類における最小二乗(2010/4/
今までPRMLを読んで実装を続けてきましたが、10章からは難しくて歯が立たなくなってきたのでここらで少し具体的な応用に目を向けてみようと思います。機械学習の応用先としては画像の方が結果を見ていて面白いんですが、当面は自然言語処理を取り上げます。そんなわけで一番始めの応用は機械学習と自然言語処理の接点として非常に重要なテキスト分類(Text Classification, Text Categorization)の技法たちを試していきたいと思います。テキスト分類は文書分類(Document Classification)という呼び方もあります。テキストと文書は同じ意味です。最初なので自分の知識の整理と入門者への紹介のためにちょっと丁寧にまとめてみました。 テキスト分類とは テキスト分類とは、与えられた文書(Webページとか)をあらかじめ与えられたいくつかのカテゴリ(クラス)に自動分類するタス
igraph – The network analysis package igraph is a collection of network analysis tools with the emphasis on efficiency, portability and ease of use. igraph is open source and free. igraph can be programmed in R, Python, Mathematica and C/C++. igraph R package python-igraph IGraph/M igraph C library python-igraph 0.9.6, the fourth bugfix release of the 0.9 series, has arrived. The preferred way of
勉強しつつ書いてみる。微妙な知識で書いてるので、おそらく間違ったことをたくさん書いてる。 まあせめて初学者らしく、初学者に通じるように平易な言葉で! やりたいこと 関数(モデル)に乱数を与えて生成した訓練データから、元の関数の振る舞いを模倣(近似)できるようにする。 pybrain Pythonで扱えるニューラルネットワークのライブラリ、だそうで。 ギッハブからインスコ $ git clone git://github.com/pybrain/pybrain.git $ cd pybrain $(sudo) python setup.py install参考: 映像奮闘記: PyBrain - a modular Machine Learning Library for Python 概要 バックプロパゲーション(誤差伝搬法) 入力層 - 隠れ層 - 出力層の三層からなり、入力層のノードは
今、python界でPyBrainが熱い!…わけじゃないですけど、個人的にけっこう注目しているライブラリ。機械学習ライブラリにおける、期待の新人が出てきなような気持ちです。 0.PyBrainとは?PyBrainっていうのはPythonによって動く、モジュール式の機械学習ライブラリです。python界ではいままでにもニューラルネットワークとかSVMなどを扱うライブラリが存在していましたが、PyBrainではそれらをより包括的に扱う、一種の環境としての機械学習ライブラリを目指しているようです。 PyBrainが優れているのはその思想もさることながら、扱っているアルゴリズムの多さにもあります。例えばFeaturesの欄を見てみると、 BackpropRpropPolicy GradientsSupport Vector MachinesEvolution StrategiesCMA-ESCom
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く