日本語のテキストデータを解析する際に、係り受けを抽出したいときがある。係り受けを行うことができるフリーのソフトウェアの一つにCaboChaがある。CaboChaは, Support Vector Machinesに基づく日本語係り受け解析器である。 ここでは、CaboChaをインストールする手順を示した後で、CaboChaを使った簡単な係り受けを見てみる。 CaboChaのインストールの手順はコンパイル環境を構築して、mecabとCRF++をインストールした後に行う。 コンパイル環境 mecabはaptからインストールできるが、CRF++とCaboChaはソースコードからコンパイルを行う必要があるため、以下のコマンドを実行しておく。 $ sudo apt-get install build-essential mecabのインストール mecabのインストールはaptから行うことができるの