タグ

ブックマーク / nlpwww.nict.go.jp (2)

  • 上位下位関係抽出ツール: Hypornymy extraction tool

    上位下位関係抽出ツールとは 上位下位関係抽出ツールは,Wikipediaダンプデータ(XMLファイル)から機械学習を使って上位下位関係の候補となる表現ペアを抽出します. 以下の3種類を情報源としています. hierarchy :箇条書きなどの階層構造から上位下位関係の候補を抽出 definition :最初の文(定義文)から上位下位関係の候補を抽出(「~とは,….」などを利用) category :category tagにある単語から上位下位関係の候補を抽出 目次 新着情報 注意事項 ダウンロード 動作環境 実行 オプション引数 ディレクトリ構成 実行コマンド入力例 Copyright 新着情報 2009-04 上位下位関係抽出ツールv0.80 リリース 注意事項 Wikipediaのデータを利用するため,処理及び処理結果の利用に際しては,Wikipediaの著作権を熟読の上

    mamoruk
    mamoruk 2009/04/29
    例のツール
  • 日本語 WordNet (wn-ja)

    語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日語をつけています。もちろん、 Princeton WordNetにはない日語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、

    mamoruk
    mamoruk 2009/03/14
    日本語版 WordNet 公開されました。
  • 1