自然言語処理(NLP)で用いられる日本語の形態素解析エンジンとして、MeCabが知られています。 本記事では、Mecabを使った日本語文章の形態素解析について、 Linux(Ubuntu)へのMeCabおよび辞書のインストールと使い方の基本 Pythonバインディング(mecab-python3モジュール)の使い方 を具体例を挙げて解説します。 Pythonバインディングのみ確認したい場合はこちらからご参照ください。 MeCabとは 日本語の形態素解析のためのツールです。下記は公式サイトより抜粋 MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです。 言語, 辞書,コーパスに依存しない汎用的な設計を 基本方針としています。 パラメータの推定に Conditional R

