2011年度と2012年度のカレントアウェアネス-Rのタイトルを形態素解析してみました。目的はD3.jsのワードクラウドを作るためです。プレゼン用に使いたかったので。 形態素解析に使用したのはPythonのigo-pythonというライブラリです。本来はJavaのプロジェクトですが、PythonだけでなくPHPやRubyにも移植されているみたいです。 Pythonで形態素解析 - よしなしごとと同じようにMeCabを使っても良かったのですが、形態素解析を使ったWebアプリを作るにはこちらの方が簡単そうということで使ってみました。解析結果などはほぼMeCab互換ということなので、どちらを利用してもよいと思います。ただ、辞書のコンパイルの手間が必要ない分MeCabの方が手軽に導入できます。 参考にしたのは、公式や以下のサイトなど igo-python を使ってみた / 桃缶食べたい。 D3.j