今回は2ちゃんねるデータを処理するという実践を行ってみます。 品詞解析ライブラリの導入 品詞解析にはいくつかのツールがありますが、今回はMeCabというツールを使用します。 MeCabのサイト URL:http://mecab.sourceforge.net/ MeCab本体と、CMeCabというMeCabをJNIで使用するライブラリを導入します。 MeCab本体のセットアップ mecab-0.98.tar.gzをダウンロード&展開します。 $ ./configure $ make $ make check # make install /usr/local/libにlibmecab.so.1が入ります。 辞書のセットアップ MeCabの動作には辞書が必要ですので、辞書のセットアップを行います。 mecab-ipadic-2.7.0-20070801.tar.gzをダウンロード&展開します