※サンプル・コード掲載 あらすじ 空前のAI(人工知能)ブームで、NLP(自然言語処理)に興味を持ち、MeCabやKuromoji等の形態素解析器を試した方は多いと思います。 ただし、いまいち形態素解析器が何に活かせるのか把握していない人は多く、その出力をどう料理すればいいのかわからない人が多いのも事実です。 そこで、本記事は形態素解析のアウトプットを利用し、最速でBag of wordsベースのテキストマイニングをする方法を解説します。 1.使用した環境 Windows or Mac Java1.8x(最新のバージョン) EclipseをIDEとして使用し、Mavenプロジェクトを作成 ライブラリ等の依存関係はMavenのpom.xmlファイルによって解決 2.Kuromojiのセットアップ 以下参照 Kuromoji(形態素解析)を2分で使えるようにする方法(Java) 3.シンプルな