非常に色々と応用が利きそうで面白かったので自分用のメモ。 昔の専攻がらみで焼けぼっくいに火が付きそう。 HadoopのMapReduceとPythonとmecabを組み合わせてテキストマイニングの取っ掛かりのお話。 条件としては 分散のHadoop環境が構築できていること デー... 続きを読む
python, mecab少し前から触れ始めたPythonで遊んで、MeCabを使ってみたのでメモを。 Mac OS XにMeCabをインストールするところから。以下の記事を参考にさせていただきました。大切なものは目に見えない - mahataの日記 次にmecab-pythonをインストール。 とり... 続きを読む
本コンテンツで使用しているMeCabと辞書のバージョンは以下になります。 ・MeCab 0.98pre ・NAIST辞書 0.6.1-20090630 相変わらず、勉強がてらに書いてます。コストの算出方法については、この記事を書きながらリアルタイムで勉強していたりするので、内容の正... 続きを読む