オープンソースの形態素解析器「Mecab」でユーザ辞書を使う方法のまとめです. 辞書を追加することで,形態素解析の精度を向上させることができます. はじめに 大雑把に手順を説明すると, 辞書に追加したい単語のリストを取得. 取得したリストを,辞書作成スクリプトに対応するフォーマットに変換. 辞書を作成. となります.以下,順に説明していきます. 辞書に追加したい単語のリストを取得 今回は,Wikipediaの全記事のタイトルとはてなのキーワードリストをユーザ辞書として追加しようと思うので,まずはそれらを取得します. # Wikipedia $ curl -L http://dumps.wikimedia.org/jawiki/latest/jawiki-latest-all-titles-in-ns0.gz | gunzip > jawiki-latest-all-titles-in-ns