タグ

corpusに関するmic1849のブックマーク (2)

  • コーパス紹介 - コーパス日本語学のための情報館

    はじめに 現在、日国内で比較的に低コストで入手可能なコーパス・言語資源の概要と入手方法を紹介します。 主に現代語の研究を想定したものです. 書き言葉 青空文庫 内容:ネット上の電子図書館青空文庫』の公開作品を一枚に収録しています。 入手方法1:「蔵書○○○○」という形で毎年更新版を500円で販売しています。現在は完売に購入はできないようです。 入手方法2:『インターネット図書館 青空文庫』を購入するとDVD-ROM(青空文庫4843作品ほか収録)が付いてきます。 関連文章:夷石寿賀子, 千葉 庄寿, 陳君慧 (2006)「『青空文庫』を言語コーパスとして使おう―メタデータ構築による歴史的・社会言語学的研究への応用の試み―」(言語処理学会第12回年次大会 (NLP2006) 発表論文集 pp.915-918) 茶漉による青空文庫の検索: 日語用例・コロケーション抽出システム『茶漉』によ

    コーパス紹介 - コーパス日本語学のための情報館
  • 少年犯罪データベースドア:デタラメな商売はもう終りにしませんか

    2008年04月18日21:27 呉智英さん、デタラメな商売はもう終りにしませんか 【断 呉智英】その時代にこれはないぜという産経新聞の記事を先日知りました。 佐々木譲さんの小説『警官の血』に時代背景に合わないおかしな言葉が出てくると編集者や校閲者まで非難し、佐々木さんとやり合いになったみたいです。 この呉さんの指摘は仮に正しい内容だったとしてもずいぶんくだらないツッコミのような気がしますが、さらに輪をかけてそのことごとくが変なんです。 「なんたらかんたら」については佐々木さんのブログで校閲さんが反証を出しているのですが、これは全13巻の小学館『日国語大辞典』の内容です。大阪では昔から普通に使われていた「なんたらかんたら」を呉さんがご存じなかったということはあり得るとしても、言葉の移り変わりを知るには一番基的な資料となるこの辞典を調べてないというのは驚きです。とくに人をあげつらうような

    少年犯罪データベースドア:デタラメな商売はもう終りにしませんか
    mic1849
    mic1849 2008/04/19
    cf.コーパス日本語学のための情報館→http://www30.atwiki.jp/corpus-ling/pages/17.html
  • 1