タグ

corpusに関するmai_squareのブックマーク (4)

  • NICE: Nagoya Interlanguage Corpus of English

    英語学習者コーパス「NICE」の紹介と配布を行うサイトです。 2008年10月4日に、正式版をリリースしました。 NICE は、日英語学習者の書いた作文を集めたコーパスデータです。 無償で利用することができます。 データには、TOEIC や TOEFL スコアが記録されていますので、習熟度別のデータ比較が可能です。 (ただし、一部のデータにはスコアのないものもあります。) NICE に関するさらに詳しい情報については、「NICE の概要と特徴」のページをご覧ください。 NICE は、Nagoya Interlanguage Corpus of English の頭文字を取ったものです。名古屋を中心にしてデータが集められたことに由来しています。

  • Jim Breen's Pages Have Moved

    Jim Breen's WWW pages at Monash University have moved to a new server.The page you have selected is now: URL=http://nihongo.monash.edu//wwwexampinf.html You will be transferred there in a few seconds.

  • 青空文庫が快挙 - Copy&Copyright Diary

    朝日新聞の日付の一面トップ記事を読んで驚いた。*1 6500作DVD1枚に 「青空文庫図書館へ無料配布 漱石 芥川 太宰 紫式部 泉鏡花 安吾 アンデルセン 魯迅 ユーゴー ドイル… 朝日新聞(夕刊). 2007年10月25日(木), 1面 赤田康和記者の署名記事。 夏目漱石やコナン・ドイルなど国内外の作家ら407人の約6500作品が1枚のDVDに収められ、全国の図書館約8千館に無償で配られることになった。民間の電子図書館青空文庫」がインターネットで提供しているデータを元に制作した。文学作品などの著作物を社会が共有する意義を強くアピールするのが狙いという。 これはスゴイ。 青空文庫は著作権が切れたものなので、配布されたDVDのデータを図書館は自由に活用できる。 DVDとして、PCなどで閲覧させるだけでなく、データを元に印刷して蔵書に充てるなど、様々な活用方法が考えられる。 これは

    青空文庫が快挙 - Copy&Copyright Diary
  • ACP Corpus: Automatically Constructed Polarity-tagged Corpus

    はじめに ACP Corpus は,文単位で評価極性タグが付与された日語コーパスです. コーパスは,(Kaji and Kitsuregawa, 2006; 鍜治, 喜連川 2008) で提案され ている手法を用いて,大規模なウェブデータから自動構築されています.タグ 付け作業を自動化することによって,およそ100万文という大規模なコーパス 構築を可能にしています. データの配布 コーパスに興味をお持ちの方は kaji (-at-) tkl.iis.u-tokyo.ac.jp まで直接ご連絡下さい. データ形式 配布するデータには,以下のような形式で一行に一文が記述されています.評価極性タグは +1/-1 (肯定的/否定的)のいずれかです. 評価極性タグ テキスト 例えば次のようになっています. -1 値段が掛かり過ぎる +1 オークションはお店よりも安く買えるものが多い +1 SC

  • 1