最近ちーと忙しいもので、ブログの間隔空ちゃってます。サーセン>< あんまりあいだ空けるのもアレなので、今日はさくらインターネットのスタンダード鯖で、MeCab を UTF-8 で使う方法を簡単にご紹介。 まず MeCab は形態素解析のライブラリです。本家サイトはこちら。 MeCab: Yet Another Part-of-Speech and Morphological Analyzer さくらインターネットのサーバには元から MeCab がインストールされてますので、単に使うだけならそのままでおkです。ただ EUC-JP 版の辞書がインスコされてますので、そのまま UTF-8 なウェブアプリで使用すると〜問題が発生します。今日ご紹介するのはそれを回避する方法です。 回避方法は簡単で、UTF-8 な辞書ファイルを別にインスコするだけです。以下、具体的なやり方。 辞書のアーカイブをサーバ
![さくらインターネットスタンダードプランで UTF-8 の MeCab を使う際のメモ](https://cdn-ak-scissors.b.st-hatena.com/image/square/cdc2a6fcbb07d858cf841199197a8633cecee9f1/height=288;version=1;width=512/http%3A%2F%2Fsakuratan.biz%2Fblog%2Fwp-content%2Fplugins%2Fwp-ogp%2Fdefault.jpg)