タグ

nlpに関するtetsuyasatoのブックマーク (2)

  • 驚異的な解析速度を誇る日本語係り受け解析器J.DepP - 自然言語処理 on Mac

    語の係り受け解析器といえば、KNPやCaboChaが有名ですが、J.DepPは線形分類器を用いて大規模な対象を非常に高速に、また高精度に解析できることが特長です。2009年末に公開されてから着実にバージョンアップされていますが、ビルドの方法が簡単になって、モデルの学習機能が追加されたことで大変使いやすくなっています。また、J.DepPは線形分類器のpeccoやopalを利用していますが、ベースの分類器が高速化されたことが、そのまま解析器の性能向上につながっているようです: ソフトウェアの更新も一人旅になってきた - ny23の日記 このJ.DepPをMacPortsとして登録しました。デフォルトの状態でjdeppをインストールすると、jumandicを参照するMeCabを組み込んだ解析器と、解析済みのブログコーパスであるKNBコーパスを対象とした学習モデルが利用できるようになります:

    驚異的な解析速度を誇る日本語係り受け解析器J.DepP - 自然言語処理 on Mac
  • Google: 大規模日本語データ公開に関する特別セッション

    グーグル株式会社では、日語の言語処理研究推進のため大規模日語データの公開を検討しています。つきましては仕様を決定するにあたり、実際にデータを御利用頂く研究者 / 技術者の皆様の「生の声」を是非お伺いしたく存じます。今回、言語処理学会様の御好意により、下記のとおりデータ仕様に関する特別セッションを設けて頂ける事になりました。 講演終了後お疲れのところとは存じますが、是非ディスカッションに参加頂き、忌憚の無い御意見をお聞かせ願いたいと存じ上げます。

  • 1