形態素解析ツールのMeCabをConoHa Wing上のPythonで動作させるところまで纏めました。文字コード関連で何点かハマったので、その部分も書いておきます。 MeCabとは MeCabはオープンソース形態素解析エンジンです。何ができるのかというと「すもももももももものうち」といった日本語文章を品詞毎に分けて出力してくれます。 % mecab すもももももももものうち すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ EOS 何が嬉しいのかというと、例えば、ある日本語記事の文章