タグ

ブックマーク / nlp.ist.i.kyoto-u.ac.jp (2)

  • JUMAN++ - LANGUAGE MEDIA PROCESSING LAB

    形態素解析システム Juman++ † Juman++は言語モデルを利用した高性能な形態素解析システムです.言語モデルとして Recurrent Neural Network Language Model (RNNLM) を用いることにより,単語の並びの意味的な自然さを考慮した解析を行います.それにより JUMAN,MeCab に比べ大きく性能が向上しています.文法・辞書・出力フォーマット等は JUMAN から引き継いだものを利用しています.システムは CREST「知識に基づく構造的言語処理の確立と知識インフラの構築」の支援により開発されました. ↑ 使用方法 † たとえば,次のようなテキストを入力すると, % cat sample.txt 外国人参政権 私もあさって日曜最終日 以下の解析結果が得られます. % cat sample.txt | jumanpp 外国 がいこく 外国

  • 機械学習に基づく自然言語処理Ⅰ

    機械学習に基づく自然言語処理 Ⅰ 黒橋 禎夫 京都大学情報学研究科 (情報通信研究機構 中川哲治氏の資料を改訂) 日の内容 • 機械学習に基づく言語処理 – 概要・特徴 – 学習コーパス – 言語処理タスクの整理 • • • • • 文書分類 ナイーブベイズ サポートベクターマシン 単語分割 依存構造解析 2 自然言語処理 自然言語処理の2つの方法論 • 規則ベースの方法 (人工知能的) – 60年代からの伝統的な手法 – 言語処理に必要な知識や規則を専門家が人手で作成 – 知識や規則の作成・保守に膨大な労力が必要 • 機械学習に基づく方法 (コーパスベース,確率・統計的) – 90年代から用いられるようになった手法,計算機の処理能力 の向上とともに発達 – コーパス(大量の言語データ)に情報(正解)を人手で付与し, そこから知識や規則を自動獲得(教師有り学習) –

    rin51
    rin51 2013/01/02
    「言語処理タスクと学習手法の例」がありがたい
  • 1