タグ

ブックマーク / www.cl.ecei.tohoku.ac.jp (6)

  • Wikipedia記事への促進・抑制関係付与コーパス

    コーパスは,Wikipedia記事1,494件に対して,促進・抑制関係を付与したコーパスです. 記事のタイトルが促進するもの(PRO),タイトルが抑制するもの(SUP),タイトルを促進するもの(PRO_BY),タイトルを抑制するもの(SUP_BY) を,記事の概要文中の表現に対してアノテーションしました. 付与対象の記事は,社会問題,災害,病気,技術革新,政策,金融,エネルギー技術,生体物質,栄養素 の5 つのカテゴリと,そのサブカテゴリ,サブサブカテゴリに収録されている記事の中から,ランダムに1,494 件を選びました. またコーパスは,クラウドソーシングを用いて1つの記事につき10人にアノテーションしていただきました.クラウドソーシングの利用にあたって,コーパスに関係知識を付与する作業をクラウドソーシングで完結させるため,アノテーションツールであるbratを改変し,Yahoo!クラ

    efcl
    efcl 2018/10/17
    Wikipediaの記事に促進・抑制関係を手動でアノテーションしたコーパス。
  • Open Resources - 東北大学 乾研究室 / Inui Lab, Tohoku University

    依存構造で意味的に構成可能な分散表現 VecDCS † 係り受けの構文解析したコーパスから、意味的に構成可能な単語ベクトルと統語ラベルの変換行列を学習するツールです。詳細は下記の文献にご参照ください。 Learning Semantically and Additively Compositional Distributional Representations Ran Tian, Naoaki Okazaki, Kentaro Inui ACL2016, pp.1277-1287 PDF ↑ 知識ベース埋め込みによる知識ベース補完モデル glimvec † Ryo Takahashi, Ran Tian and Kentaro Inui. Interpretable and Compositional Relation Learning by Joint Training with an

    efcl
    efcl 2018/10/17
    NLP関係の公開ツール、リソースについて。 構文解析やコーパス
  • Open Resources/Japanese ESP Dictionary - 東北大学 乾研究室 / Inui Lab, Tohoku University

    efcl
    efcl 2017/01/07
    後続する述語が重要な要素となるケースについて。 直前の事象を打ち消すことができる述語の辞書(モダリティおよび事実性に影響を与える述語 - 事象選択述語)
  • Open Resources/normalizeNumexp - 東北大学 乾研究室 / Inui Lab, Tohoku University

    efcl
    efcl 2017/01/07
    "日本語の文中に含まれる数量表現・時間表現を高速かつ正確に抽出、規格化するツール" 日本語の数値表現の分析アルゴリズム
  • 日本語評価極性辞書 - Open Resources/Japanese Sentiment Polarity Dictionary - 東北大学 乾・岡﨑研究室

    語評価極性辞書(名詞編) † 評価極性を持つ(複合)名詞,約8千5百表現に対して評価極性情報を付与した,人手によるチェック済みのデータ.名詞の評価極性は概ね以下の基準に従う(東山, 2008). 〜である・になる(評価・感情)主観: 「○○が〜である・〜になる」ことは,○○をP/Nと評価しているか? ポジティブ:誠実,安寧,親切,中立,名手,英雄,第一人者,幸せ ネガティブ:弱気, 〜である・になる(状態)客観: 「〜(という状態)になる」ことは良いことか悪いことか? ポジティブ:合格者,快晴 ネガティブ:ガン 〜い(評価・感情)主観: 「〜い」は良いか悪いか? ポジティブ:美しさ ネガティブ:弱さ 〜する(感情)主観: 「〜する」は良い感情か,悪い感情か? ポジティブ:感嘆 ネガティブ:失望 〜する(出来事): 「〜する」ことは嬉しいことか嫌なことか? ポジティブ:善戦,成就,合格

    efcl
    efcl 2017/01/07
    感情表現の評価の辞書 単語ごとにポジティブかネガティブなのかの値を入れている。 > 人手で評価極性情報を付与したデータ
  • 言語処理100本ノック 2015

    言語処理100ノックは,実践的な課題に取り組みながら,プログラミング,データ分析,研究のスキルを楽しく習得することを目指した問題集です 実用的でワクワクするような題材を厳選しました 言語処理に加えて,統計や機械学習などの周辺分野にも親しめます 研究やデータ分析の進め方,作法,スキルを修得できます 問題を解くのに必要なデータ・コーパスを配布しています 言語はPythonを想定していますが,他の言語にも対応しています

    efcl
    efcl 2015/03/13
    言語処理の例題集。 自然言語の処理、形態素解析の処理など
  • 1