mecabにwikipediaのタイトルの単語を追加します。 ググると、既に様々な人がされているので、参考にさせて頂きました。また、本家のサイトで詳しく説明されています。 csvファイルの作成にperlを使いました。 以下が作業の流れです。 1)wikipediaのデータをダウンロード 2)ダウンロードしたデータからユーザ辞書のCSVファイルを作成 3)CSVファイルを辞書ファイル(.dic)へ変換 wikipediaのタイトルを辞書に追加すると $ mecab 千と千尋の神隠し 千 名詞,数,*,*,*,*,千,セン,セン と 助詞,格助詞,引用,*,*,*,と,ト,ト 千尋 名詞,一般,*,*,*,*,千尋,チヒロ,チヒロ の 助詞,連体化,*,*,*,*,の,ノ,ノ 神隠し 名詞,一般,*,*,*,*,神隠し,カミガクシ,カミガクシ EOS これが $