タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

コーパスに関するhisabohのブックマーク (2)

  • nlp1-11.key

    1 11. テキスト処理 (コーパスの処理) 自然言語処理論 I 2 例文集 実際に使用されている例文を大量に集めたもの テキストコーパス 文章を集めたもの 新聞記事、雑誌、小説、辞書など 音声コーパス 音声データを集めたもの 対話、インタビュー、講演など コーパス(corpus)とは? 3 昔 機械可読データを集めること自体が困難 コーパスの量が重視された 今 電子化文書の普及 新聞記事、レポート、ウェブ文書、blog コーパスにどのような付加的な情報をつけるかと いうことに重点が置かれている 注釈付きコーパス(annotated corpus) 量から質へ 4 コーパスに情報を付加したコーパス 主なもの (平文コーパス) 品詞タグ付きコーパス 単語の品詞 単語境界 構文構造付きコーパス 文の構文木 文節の係り受け関係 注釈付きコーパス 5 主なもの 語義タグ付きコーパス 単語の語義 パ

  • 国立国語研究所の言語コーパス整備計画KOTONOHA

    国立国語研究所が中心となって,2006年度から5年計画で構築している「現代日語書き言葉均衡コーパス」(Balanced Corpus of Contemporary Japanese,略称BCCWJ)の紹介。BCCWJは,書籍,雑誌,新聞,白書,ベストセラー,Web(掲示板,ブログ),法律,論文等を収録する1億語規模のコーパスです。国立国語研究所では、明治から現代にいたる日語の全貌を把握するための言語コーパスKOTONOHAを構築しています。2006年度から5年間は、現代日語の書き言葉を対象としたコーパスの構築を進めます。サイトでは、この書き言葉コーパスについて説明します。 モニター公開データ利用者アンケート (2010.07.25) モニター公開データの利用者の方を対象に利用実態アンケートを実施しています。(締め切りを2010年8月6日に延長しました) 報告書の追加 (2010.

  • 1