ブックマーク / www.ntt-tec.jp (1)

  • 意味解析技術の基盤となる言語データベース | NTT Technology licensing Site

    NTTコミュニケーション科学基礎研究所では、人間のようにことばを操るコンピュータの実現を究極の目標として、ことばの意味をコンピュータ上で表現する方法や、人間が話したり書いたりしたことばをコンピュータ向きの意味表現に変換して高度な言語処理アプリケーションを実現する方法について研究を行ってきました。 この研究の一環として、日語最大級のシソーラスである「日語語彙大系」を構築してきました。 「日語語彙大系」では日語の単語30万語の意味を、3,000カテゴリに体系立てて整理しています。 また、日語の用言(動詞や形容詞)6,000語の意味を、用言にかかる名詞との組み合わせ(結合価パターン)で定義しています。これらは同種のコンピュータ用辞書に比べてはるかに大きな規模であり、広範な日語表現をカバーするものです。 これらの情報は、機械翻訳や情報検索、推敲支援などの様々な計算機による日語処理

    gmtaya
    gmtaya 2011/10/24
    日本語語彙大系
  • 1