タグ

ブックマーク / nlp.kuee.kyoto-u.ac.jp (3)

  • Public Morphologically Tagged Corpus

    形態素解析済みコーパスの公開 形態素解析済みのコーパスを公開します。 コーパスは、ウェブでフリーで公開されているテキストに対し、自動的に形態素解析を行い、その情報を付与したものです。 データのフォーマットは国立国語研究所で公開している全文検索システム『ひまわり』に準拠しています。 利用者の皆様は、データをダウンロードし、『ひまわり』をパソコンにインストールすれば、 単語単位での例文検索 基形での例文検索 品詞による検索結果の絞り込み といった作業を簡単に行うことができます。 動作環境 データを利用するのに必要な環境は以下の通りです。 パソコン Windows, Linux, Mac OS X などのパソコンでデータをお使いになれます。 下記の『ひまわり』が動作する環境のパソコンであれば大丈夫です。 全文検索システム『ひまわり』 国立国語研究所の『ひまわり』のサイトからプログラ

    hayato34
    hayato34 2010/06/25
    形態素解析済みコーパスの公開
  • 講義名(自然言語処理に関連する講義資料へのリンク)

    自然言語処理に関連する講義資料へのリンク お願い: このリストに追加すべきページをご存知の方は、nlp_portal あっと nlp.kuee.kyoto-u.ac.jpまでご連絡下さい。 講義名: 自然言語処理論 大学: 北陸先端科学技術大学院大学 キーワード: オートマトン,文脈自由文法,形態素解析,構文解析,情報検索,機械翻訳 ファイル形式: pdf URL: http://www.jaist.ac.jp/~kshirai/lec/i223/index.html (スライド) 講義名: 言語情報科学 大学: 東京大学 キーワード: 形態素解析,情報抽出,自動要約,機械翻訳,情報検索 ファイル形式: ppt URL: http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/suri-GJK/syllabus.html (スライド)

    hayato34
    hayato34 2010/06/16
  • 言語情報処理 用語集

    [索引] [あ行] [か行] [さ行] [た行] [な行] [は行] [ま行] [や行] [ら行] [わ行] あ行 アーリーアルゴリズム (Earley algorithm) 文脈自由文法に基づく構文解析アルゴリズム.ある非終端記号の直後に現われ得る終端記号を事前に予測することによって解析効率を改善している点が特徴. IIS (Improved Iterative Scaling algorithm) 最大エントロピー法のパラメタを学習するアルゴリズム. 曖昧性 (ambiguity) 自然言語処理では,複数の解析結果が得られることを曖昧性があるという.例えば複数の語義がある場合は語義(選択)に曖昧性があるといい,かかり受け解析において複数の可能性がある場合は,かかり受けに曖昧性があるという.曖昧性は様々な処理レベルで存在し,曖昧性解消(ambiguity resolution, disa

    hayato34
    hayato34 2009/12/13
    言語情報処理 用語集
  • 1