形態素解析は、簡単に言うと文章を単語にばらすことです。たとえば、「これはテストです。」という文章を形態素解析すると、「これ は テスト です 。」のように5つの単語に分割されます。 さらに各単語の品詞も知ることができます。先の例だと、これ(名詞)は(助詞)テスト(名詞)です(助動詞)。(記号)のようになります。単語の品詞が分かると、名詞だけ取り出してその文章の話題を簡単に把握したり「テストは好き?」などユーザが入力した単語を元に質問文を作成する人工無脳が作れそうです。 Sen † Javaで使える形態素解析エンジンにSenというのがあります。実際にSenをダウンロードしてみたのですがコンパイルや辞書の構築などセットアップがややこしく使うまで苦労しました・・・そんなわけで本サイトでエンジン、辞書をまとめたものを用意しました(再配布は許可されています)。Windows前提なので文字コードはすべ