MeCabは形態素解析のためのソフトウェアです。日本語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日本語や、正しく書かれた日本語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術は形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解
mecab, php, centosPHP5.4.0RC6でphp_mecabのインストールに失敗して、でもめげずにインストールしました。怒涛の1時間ちょいの作業内容をまとめました。 ちなみに、PHP5.4.0RC6はremi-testレポジトリからyumでインストールしました。 スタートからエラーがでるまでは、馴染みのあるソースコードインストールの流れです。途中のphpizeっていうコマンドはPHP本体のソースコードを再コンパイルしなくてもいいようにしてくれるらしい!prefixは本当はいらないのかな?php-configやmecab-configは設定しなくても変な場所に設置していなければ、自動でみつけてくれます。 # ソースコードをダウンロードしてきて、作業用ディレクトリに移ります cd /usr/local/src/ wget http://pecl.opendogs.org/ge
Registering the channel: pear channel-discover pecl.opendogs.org Listing available packages: pear remote-list -c opendogs Installing a package: pear install opendogs/package_name Installing a specific version/stability: pear install opendogs/package_name-1.0.0 pear install opendogs/package_name-beta Receiving updates via a feed: http://pecl.opendogs.org/feed.xml gdextra - The PHP extension which e
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く