タグ

cabochaに関するtnalのブックマーク (2)

  • 驚異的な解析速度を誇る日本語係り受け解析器J.DepP - 自然言語処理 on Mac

    語の係り受け解析器といえば、KNPやCaboChaが有名ですが、J.DepPは線形分類器を用いて大規模な対象を非常に高速に、また高精度に解析できることが特長です。2009年末に公開されてから着実にバージョンアップされていますが、ビルドの方法が簡単になって、モデルの学習機能が追加されたことで大変使いやすくなっています。また、J.DepPは線形分類器のpeccoやopalを利用していますが、ベースの分類器が高速化されたことが、そのまま解析器の性能向上につながっているようです: ソフトウェアの更新も一人旅になってきた - ny23の日記 このJ.DepPをMacPortsとして登録しました。デフォルトの状態でjdeppをインストールすると、jumandicを参照するMeCabを組み込んだ解析器と、解析済みのブログコーパスであるKNBコーパスを対象とした学習モデルが利用できるようになります:

    驚異的な解析速度を誇る日本語係り受け解析器J.DepP - 自然言語処理 on Mac
  • 述語項構造をsynchaで解析する - 自然言語処理 on Mac

    synchaは、CaboChaで求まる文の係り受け関係に基づいて、述語を中心とした文の構成要素の構造を解析します。同じ述語でも、構成要素の種類が変わると意味が異なる場合があります。逆に、構成要素の構造が同じであれば、異なる述語同士であっても同じような意味をとる場合があります。格フレームは、述語の意味ごとに規定されて構成要素をスロットとする構造体ですが、文の格フレームが解析できると、述語の意味や構成要素がどのような役割をもつのかが分かります。また、文脈に埋もれて記述に省略がある場合でも、何があるべきかが推定できます。なお、KNPも、Webテキストから構築した大規模格フレームに基づいた述語項構造の解析が可能です。 オリジナルのsynchaはEUC-JPベースですが、MacPortsでは、UTF-8ベースのCaboCha-0.60を利用して、データもUTF-8に変換することで、入出力をUTF-8

    述語項構造をsynchaで解析する - 自然言語処理 on Mac
  • 1