タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

791日本語と751研究に関するoguoguのブックマーク (1)

  • 「風景」と「光景」の違いは? 国立国語研が大量の日本語データ公開

    国立国語研究所は2007年5月28日、約1000万語分の日語の書き言葉データをインターネット上で試験公開したと発表した。各省庁が刊行した白書のデータ(約500万語分)と、ヤフーのQ&A情報サイト「Yahoo!知恵袋」に投稿されたデータ(約500万語分)から成る。こうした大量の言語データは「コーパス」と呼ばれ、言語にまつわる研究開発で活用されている。同研究所は現在、「現代日語書き言葉均衡コーパス」と呼ぶ大規模コーパスの構築を進めており、今回公開したのはその一部。研究者に限らず誰でも無償で検索、閲覧が可能だ。「“風景”と“光景”など、辞書では違いが分かりにくい言葉でも、大量の用例を見ればすぐ分かる」(研究開発部門の前川喜久雄言語資源グループ長)など、一般の人にとっても、日語の使われ方を知るうえで便利なデータとなりそうだ。 コーパスは、日語学や日教育はもちろん、自然言語処理のように情

    「風景」と「光景」の違いは? 国立国語研が大量の日本語データ公開
  • 1