aidiaryのブックマーク - はてなブックマーク

aidiary id:aidiary

ブックマーク / saket.hatenadiary.org (5)

Risky Dune
medline.txtはhttp://www.ncbi.nlm.nih.gov/pubmed/ の検索フォームで適当なワードを検索し、検索結果をXMLでひっぱってくることで代用した。XMLをtxtに変換するスクリプトは以下。 egrep -E '' medline.xml | sed -e 's/<\/AbstractText>//g' | sed -e 's/ *//g' > medline.txt 仮想化でまったくWindowsのデバイス周りの知識がないことがわかったので、ちょっと勉強した。主にデバイスドライバのインストール方式(infファイルの読み方)と、どうやってデバイスとドライバをマッチングするかを調べた。まず、Windowsにおけるデバイスドライバの知識を次の資料で学習。 Windowsを動かすデバイスドライバーの仕組み前編デバイスノードとデバイススタック上でデバイ
aidiary 2014/03/07
scikit-learn関係の記事が参考になる

機械学習
リンク
Theano 解説 - Risky Dune
「Deep Learning Implementation」でググるとトップに出てくることで, たまに話題になるライブラリ Theano について簡単に調べたので紹介する. 間違いがあったら是非教えて欲しい. なお, Deep Learningに関する解説は今回は行わない. TheanoとはPythonにおける数値計算用のライブラリである. 行列演算などを行う関数を提供しており, numpy/scipyの代替パッケージと思えばいいだろう. 大きな特徴は実行時におけるC++コードの生成とコンパイル GPUサポート解析的な微分のサポート (x^2の微分=2xという操作を自動でやってくれる) の3つである. 一部は後に詳細を説明する. これによってMultilayer Perceptronを実行するベンチマークでは, Theanoがnumpyより1.8倍, Matlabより1.6倍速いという
aidiary 2014/02/07
Deep Learning

Theano
リンク
scikit.learn手法徹底比較！イントロダクション - Risky Dune
MNIST手書き文字データセットを利用してscikit.learnのsupervisedな分類アルゴリズムを比較する. パラメーターチューニングや計算時間の感覚が掴みたくて, １回やってみたかった. MNIST手書き文字データセットとは, 機械学習初学者が何故か必ず与えられると言われている0から9の手書き文字が描かれた画像のデータセットである. データ概要次元: 28*28の784次元値の範囲: 0-255の整数クラス数: 0-9の10クラス評価環境: scikit.learn(sklearn): 0.10 CPU: Xeon E5-2667 (6コア 2.9 GHz) メモリ: 8GB この条件でscikit.learnが提供しているアルゴリズムを適用していく. 訓練データ数は, 1000から20000まで変化させ分類精度, 学習時間, 分類時間の推移を観察する. 最終的には全手
aidiary 2014/01/30
機械学習
リンク
PythonからのHMMライブラリの利用 - Risky Dune
PythonからHMM(隠れマルコフモデル)ライブラリであるghmmを利用する方法の紹介です. インストール方法は公式ページhttp://ghmm.org/を参照. 次のサンプルコードは, いかさま師をモチーフにしたHMMを生成しています. HMMの出力はいかさま師のサイコロの目に相当します. イカサマ師は2種類のサイコロ(普通の奴と6しか出ない奴)を適当に切り替えて使っています. その出力列だけを見て, 状態遷移確率と出力分布の確率を学習しているのが以下のコードです. import ghmm import random def random_matrix(n,m): "n,mのrandom配列を返す" result = [[0.0] * m for i in range(n)] for i in range(n): for j in range(m): result[i][j] = ra
aidiary 2013/09/03
Python

機械学習
リンク
ゆるふわ Restricted Boltzmann Machine - Risky Dune
Deep Learningで用いられるらしいということで, Restricted Boltzmann Machine(RBM)について調べたので概要とPythonによる実装例をまとめた. 主にAn Introduction to Restricted Boltzmann Machinesを参考にしているので, 数式の詳細はそちらをあたって欲しい. 概要 Restricted Boltzmann Machineは分布をモデル化するアルゴリズム. 目的は, 与えられた観測変数の集合からその確率分布を求めることだ. RBMでは観測変数の他に隠れ変数を導入する. そして, を求めたのち, 周辺化によってを求める. RBMではは次のように表される. ただし, . Eはエネルギーと呼ばれるもので, エネルギーが小さい状態程起こる確率は高くなる. 水は低きに流れる的な精神. また, の3つはこのモデルの
aidiary 2013/05/09
Deep Learning
リンク
1