日本語の文章を形態素分析すると何が起きるだろう?というふとした好奇心より、形態素分析エンジン「茶筌(ChaSen)」を導入する。 元ネタは、Yet Another 仕事のツール(45) 日本語形態素解析ツール「ChaSen」。 ソフトウェアのインストール まずは、Darts というソフトウェアが前提として必要らしい。「Darts は, Double-Array [Aoe 1989]を構築するための シンプルな C++ Template Library です.」とのこと。 最新の darts-0.31.tar.gz をインストールする。ちなみに私の環境は Debian Linux sarge である。 % tar zxvf darts-0.31.tar.gz % cd darts-0.31 % ./configure % make % make check % sudo make insta