タグ

ブックマーク / www.ar.media.kyoto-u.ac.jp (6)

  • えだ 係り受け解析器 | EDA Parser

    EDA係り受け解析器 EDA(えだ)は単語係り受け解析器です。 ちなみにEDAというのはEasily adaptable Dependency Analyzerの省略です。 特徴 部分的アノテーションコーパスからの学習:通常、学習データを用意する時は文中の全ての単語に係り先を付与しなければなりませんが、EDAの場合は注目単語のみに係り先を付与すればよいです。 交差する係り受けも扱える:右方向の係り受けなら、交差する係り受けを問題なく扱うことができます。 注:日語の書き言葉を対象としているため、文中の全ての単語の係り先が必ずその単語の右側(文末方向)にあるという制約を使っています。日語の話し言葉などに現れる左方向への係り受けが扱えませんのでご注意下さい。 ダウンロード・インストール ダウンロード 最新のバージョン:EDA 0.1.0 最新のソースコード(未リリース):Bitbucketリ

  • Survey1

    Survey1 SVMを用いた固有表現抽出に関する論文のサーベイ 1.Support Vector Machineを用いた日語固有表現抽出 2.Support Vector Machineの多値分類問題への適用法について 3.SVMに基づく固有表現抽出の高速化 4.日語固有表現抽出における文節情報の利用 5.Stackingの効率的な学習方法と日語固有表現抽出での評価 6.非頻出語に対して頑健な日語固有表現の抽出 7.大域的情報を用いた日語固有表現認識 SVMを利用した日語固有表現抽出に関する論文が中心です. 固有表現タグを入力文の解析単位毎に正確に付与することが目的です. チャンカーは基的にYamCha 1.Support Vector Machineを用いた日語固有表現抽出 山田寛康 工藤拓 松裕治 奈良先端科学技術大学院大学情報科学研究科 概要

  • クラスタリング

  • 機械学習入門勉強会

    京大 河原研・黒橋研 を中心に、機械学習の基礎を復習し、実際の実装を行ってみるという勉強会を開催しています。 教科書を 自然言語処理のための機械学習入門 とし、輪講→各自で実装→実装のレビューを行います。 興味のある方は所属を問わず歓迎しますので、吉野(yoshino [at] ar.media.kyoto-u.ac.jp)までご連絡下さい。 日程

    yuiseki
    yuiseki 2011/05/31
  • Koichiro YOSHINO

    English/Japanese Profile 吉野 幸一郎(Koichiro YOSHINO) 京都大学大学院 情報学研究科 知能情報学専攻 メディアアーカイブ分野 河原研究室 修士課程2年 略歴 2005年4月 慶應義塾大学 環境情報学部 入学 2009年3月 慶應義塾大学 環境情報学部 卒業 2009年4月 京都大学大学院 情報学研究科 修士課程 入学 在学中 学部在籍時、慶應義塾大学 石崎俊研究室 自然言語処理グループに所属。 修士課程より、京都大学 河原達也研究室 に所属。 言語処理学会会員 研究・興味 音声対話システム 音声言語処理 自然言語処理 Web情報を利用した、音声対話システムにおける応答生成の研究を行っています。 マルチドメイン音声対話システムを自動構築する上で、ドメインごとの構造に基づく情報抽出を利用する研究をしています。 ドメイン適応型音声対話シス

    yuiseki
    yuiseki 2011/05/31
  • LIBLINEARを用いた機械学習入門(単語分割)

    このページでは機械学習のツール(LIBLINEAR)を利用して、実際に分類問題を解くにはどういう手順を経るかということについて解説します。つまり、Kytea(京都テキスト解析ツールキット)における簡易版の単語分割モデルを作ってみようということです。 なお今回はプログラミング言語としてRubyを用いますが、Rubyの知識がなくても実装ができるように解説するよう心がけます。また、必要以上に細かく書いてあるかもしれませんが、不要な方は適宜読み飛ばして下さい。 細かい説明はすっとばしてやり方を見る 機械学習って? 朱鷺の杜Wiki 「機械学習」がわかりやすいかと思います。 ひとことで言うと、「訓練データを与えてそこから機械に問題の解き方を学んでもらい、別の問題を解いてもらうこと」です。 教師あり学習・教師なし学習 機械学習は大きく「教師あり」と「教師なし」に分かれます。 「教師あり学習」とは

  • 1