タグ

ブックマーク / alaginrc.nict.go.jp (2)

  • 日本人1200人による英語コーパス・The NICT JLE Corpus

    人1200人による英語コーパス・The NICT JLE (Japanese Learner English) Corpus English Page コーパスについて The NICT JLE Corpusは、日語を母語とする英語学習者1,281名分の英語インタビューテスト(株式会社アルクによるStandard Speaking Test)における発話を書き起こしたデータを中心に構成されています。話し言葉の学習者コーパスとしては、世界最大級の規模のデータを収録しています(書き起こしテキストのデータのみで、音声データは含まれておりません)。 コーパスは、国立研究開発法人情報通信研究機構が株式会社アルクの協力のもと、構築しました。 ※Webサイトからダウンロードできるコーパスは、2004年既刊の書籍『日人1200人の英語スピーキングコーパス』に付属のコーパスと同様の内容です。一

    mamoruk
    mamoruk 2012/10/17
    これも使いたいですね
  • CNP - A ChiNese dependency Parser

    Introduction CNP is a highly accurate dependency parser for Chinese. This package includes: Modifications of the MSTParser (http://sourceforge.net/projects/mstparser), such as: support for Carreras et al. (2007)'s higher-order decoding support for subtree features described in Chen et al. (2009) Especially, CNP has the following features: High accuracy due to the use of the features based on subtr

    mamoruk
    mamoruk 2010/10/17
    MSTParser を改良して higher-order な素性も使えるようにしたものらしい
  • 1