サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
買ってよかったもの
www.tkl.iis.u-tokyo.ac.jp/~kaji
はじめに 大規模な評価文コーパス(Kaji and Kitsuregawa, 2006)から自動構築した評価表現辞書です. 形容詞/形容詞句と評価極性値のペアが約10,000組登録されています. 評価極性値とは評価極性の強さを表す指標で,この値が0より大きい/小さいと好評極性/不評極性を持つことになります. ここでの評価極性値は,Pointwise Mutual Informatoin (PMI)にもとにして決定しています. 詳細に関しては文献(Kaji and Kisturegawa, 2007)を参照してください. 辞書データに興味をお持ちの方は kaji (-at-) tkl.iis.u-tokyo.ac.jp まで直接ご連絡下さい. データ形式 「評価極性値 評価表現」という形式で一行に一表現が記述されています.文字コードは eucjp です. 例えば以下のようになっています. 1
はじめに ACP Corpus は,文単位で評価極性タグが付与された日本語コーパスです.本 コーパスは,(Kaji and Kitsuregawa, 2006; 鍜治, 喜連川 2008) で提案され ている手法を用いて,大規模なウェブデータから自動構築されています.タグ 付け作業を自動化することによって,およそ100万文という大規模なコーパス 構築を可能にしています. データの配布 本コーパスに興味をお持ちの方は kaji (-at-) tkl.iis.u-tokyo.ac.jp まで直接ご連絡下さい. データ形式 配布するデータには,以下のような形式で一行に一文が記述されています.評価極性タグは +1/-1 (肯定的/否定的)のいずれかです. 評価極性タグ テキスト 例えば次のようになっています. -1 値段が掛かり過ぎる +1 オークションはお店よりも安く買えるものが多い +1 SC
このページを最初にブックマークしてみませんか?
『http://www.tkl.iis.u-tokyo.ac.jp/~kaji/』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く