はじめに 本記事では形態素解析器ChaSenでUTF-8を扱うための手順を説明します。 環境はMac上のVagrant、bento/centos-6.7です。(Macの環境を汚したくなかったためVagrantにしました。) なお、この手順に従うとEUC-JPで読むことはできなくなります。
形態素解析による日本語自然言語処理システムであるChaSenをインストールしたメモ。 環境:centos6.3 こことここを参考にインストールしてみました 環境:centos6.3 まずはChaSenの情報を見に行く http://chasen-legacy.sourceforge.jp/ http://sourceforge.jp/projects/chasen-legacy/ iconvと Darts-0.31が必要らしい。 まずはDartsから。3,2があったので、そっちを入れる。 $ wget http://chasen.org/~taku/software/darts/src/darts-0.32.tar.gz gtar xvzf darts-0.32.tar.gz cd darts-0.32 ./configure make make check sudo make insta
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く