zmsgnkのブックマーク / 2014年9月3日

zmsgnk id:zmsgnk

2014年9月3日のブックマーク (5件)

Elasticsearch の Kuromoji でユーザー辞書を使う - Qiita
Elasticsearchでの形態素解析はKuromoji一択だけど、やや辞書が貧弱な部分もある。例えば東京に「西国分寺駅」という駅があるけど、「西国分寺」で形態素解析すると「西」「国分寺」で分かれる。読みも「サイコクブンジ」となってしまう。（正しくは「ニシコクブンジ」）なので、ある程度ユーザー辞書で補いたいと思う。参考になったサイト elasticsearch-analysis-kuromojiでユーザ辞書の利用方法 Elasticsearch 日本語で全文検索その２環境 CentOS 6.4 Elasticsearch 1.1.1 kuromoji 2.0.0 辞書ファイルの作成まず辞書ファイルを作成。普通のテキストファイルで、文字コードは UTF-8。拡張子は自由。ここでは例として「my_jisho.dic」とした。辞書ファイルの置き場所ファイルの保存先は /e
zmsgnk 2014/09/03
Kuromoji

elasticsearch

形態素解析
リンク
http://www.bi.a.u-tokyo.ac.jp/~tak/index.html
zmsgnk 2014/09/03
SVM

機械学習
リンク
SVM のチューニングのしかた（１） - ほくそ笑む
SVM のチューニング SVM(Support Vector Machine) はみなさん御存じ機械学習の手法です。 SVM はデフォルト設定でモデルを作ってもしょうがないです。gamma と cost というパラメータがあるので、これらの値に最適値を設定しなければなりません。R の SVM の Help にもこう書いてあります。 Parameters of SVM-models usually must be tuned to yield sensible results! (訳) SVM でいい結果出したかったらチューニングしろよな！というわけで、SVM のチューニングのしかたについて説明したいと思います。交差検証おっと、その前に、交差検証の話をしなければなりません。 SVM モデルをチューニングする際、二つのパラメータでグリッドサーチをします。すなわち、パラメータをいろいろ変
zmsgnk 2014/09/03
SVM

機械学習

R
リンク
パッケージユーザーのための機械学習(3)：サポートベクターマシン(SVM) - 渋谷駅前で働くデータサイエンティストのブログ
（※はてなフォトライフの不具合で正しくない順番で画像が表示されている可能性があります） PythonでSMO-SVM書き下すという宿題がまだ終わってないくせにこれ書いていいのか物凄く迷うんですが（笑）、R Advent Calendar 2013の12月6日分第6回の担当に当たっているのでついでに書いちゃいます。なのですが。実はその12月6日は米ネバダ州・タホ湖畔で開催中のNIPS 2013に参加中*1でupできるかどうか分からない*2ので、タイムスタンプ変えて予めupさせてもらいました。ルール破っちゃってごめんなさい。。。ということで、今回の参考文献はこちら。未だに評は分かれるみたいですが、僕が推すのはいわゆるSVM赤本こと『サポートベクターマシン入門』です。サポートベクターマシン入門作者: ネロクリスティアニーニ,ジョンショー‐テイラー,Nello Cristianini,Jo
zmsgnk 2014/09/03
機械学習

SVM
リンク
Python Dictionary to CSV
zmsgnk 2014/09/03
python
リンク
- 2014年9月4日
- 2014年9月3日
- 2014年8月31日