livedoor Techブログ : wikipediaのデータや顔文字辞書からmecabのユーザ辞書を作成するフレームワークを使って辞書をパワーアップした。 それでもって、MongoDBに保存してあるツイートをノーマライズして形態素解析して、DBを更新(ノーマライズしたテキストと形態素解析したやつのリストを保存)するスクリプトを書いた。 #!/usr/bin/perl use strict; use warnings; use Encode; use Encode::JP; use FindBin; use lib "$FindBin::Bin/../lib"; use MecabTrainer::Config; use MecabTrainer::Utils qw(:all); use MecabTrainer::NormalizeText; use MongoDB; use Mong
![Twitter用にMecabの辞書をパワーアップ #perl](https://cdn-ak-scissors.b.st-hatena.com/image/square/126e9c63960837b5815901e11e1f6c1303c17f2b/height=288;version=1;width=512/https%3A%2F%2Fblog.seesaa.jp%2Fimg%2Fogp_logo.png)