ブックマーク / alaginrc.nict.go.jp (2)

  • 日本人1200人による英語コーパス・The NICT JLE Corpus

    人1200人による英語コーパス・The NICT JLE (Japanese Learner English) Corpus English Page コーパスについて The NICT JLE Corpusは、日語を母語とする英語学習者1,281名分の英語インタビューテスト(株式会社アルクによるStandard Speaking Test)における発話を書き起こしたデータを中心に構成されています。話し言葉の学習者コーパスとしては、世界最大級の規模のデータを収録しています(書き起こしテキストのデータのみで、音声データは含まれておりません)。 コーパスは、国立研究開発法人情報通信研究機構が株式会社アルクの協力のもと、構築しました。 ※Webサイトからダウンロードできるコーパスは、2004年既刊の書籍『日人1200人の英語スピーキングコーパス』に付属のコーパスと同様の内容です。一

  • 意見(評価表現)抽出ツール

    目次 意見(評価表現)抽出ツールとは 高度言語情報融合フォーラム(ALAGIN)で公開されているモデルデータと辞書データについて 新着事項 ご利用にあたっての注意事項 ダウンロード ツールの実行環境 意見(評価表現)抽出ツールの動作確認方法 モデルデータの生成 このパッケージに含まれているディレクトリ・ファイル 解析精度 参考文献 著作権&ライセンス 付録 意見(評価表現)抽出ツールとは ツールは、国立研究開発法人情報通信研究機構 旧知識処理グループ 情報信頼性プロジェクトによって開発されたもので、1行につき1文が書かれたテキストファイルを入力として、機械学習を使って何らかの事象に対する意見や評判および評価(以下、これらをまとめて「評価情報」と呼びます)がテキスト中のそれぞれの文に存在するかどうかの判定を行い、その文に評価情報が存在すると認められた場合、以下の情報を出力するツールです。

  • 1