タグ

コーパスに関するhate-urumaのブックマーク (4)

  • データベース・コーパス・資料 | 国立国語研究所

    大学共同利用機関法人 人間文化研究機構 国立国語研究所 〒190-8561 東京都立川市緑町10-2【交通案内】 Tel. 0570-08-8595 (ナビダイヤル) (c) National Institute for Japanese Language and Linguistics

    データベース・コーパス・資料 | 国立国語研究所
  • 利用規約┃NINJAL-LWP for BCCWJ

    ■NINJAL-LWP for BCCWJ 利用規約 このサイトをご利用される前に、以下の利用に関する規約をご覧の上同意してください。 NINJAL-LWP for BCCWJ(以下「NLB」という。)一般公開版を利用するにあたり、下記の利用条件を遵守してください。 1(著作権の帰属) NINJAL-LWP for BCCWJの著作権は、国立国語研究所及びLago言語研究所に帰属します。 2(許諾の範囲等) (1)NLBの利用は、研究・教育目的での利用に限定します。商業利用の場合は別途ご相談ください。 (2)NLBの検索結果の複製を禁じます。 (3)国立国語研究所、Lago言語研究所または第三者の著作権その他の権利を侵害することを禁じます。 3(研究成果の公表) 2に反しない範囲でNLBを利用して得られた研究成果や知見を公表する場合、NLBの利用による成果であることを明記してください。 4

  • SCN:PERC Corpus

    お知らせ 不具合のご報告と改修のお知らせ(2020年8月23日更新) 2023年 2月 1日新規ご入会、トライアル利用受付終了(2023年3月末)のご案内 「小学館コーパスネットワーク」は2024年3月末をもちましてサービス終了となります。 これに伴い、新規ご入会、トライアル利用受付を2023年3月末にて終了させていただきます。 お客様にはご迷惑をおかけしまして誠に申し訳ございませんが、何卒ご理解賜りますようお願い申し上げます。 2022年11月29日CJECコーパス改訂のお知らせ これまでのCJECコーパスで修正対象となっていた以下の点を改めました 1. 同一サイトに共通して出現する定型文(お知らせやクレジット等)を可能な範囲で取り除きました。 2.「政治経済」カテゴリに混在していた他分野ファイルを可能な範囲で分離・修正しました。 3. CEFRクラスA1の見直しを行い、一部ファイルの削

    SCN:PERC Corpus
  • nlp1-11.key

    1 11. テキスト処理 (コーパスの処理) 自然言語処理論 I 2 例文集 実際に使用されている例文を大量に集めたもの テキストコーパス 文章を集めたもの 新聞記事、雑誌、小説、辞書など 音声コーパス 音声データを集めたもの 対話、インタビュー、講演など コーパス(corpus)とは? 3 昔 機械可読データを集めること自体が困難 コーパスの量が重視された 今 電子化文書の普及 新聞記事、レポート、ウェブ文書、blog コーパスにどのような付加的な情報をつけるかと いうことに重点が置かれている 注釈付きコーパス(annotated corpus) 量から質へ 4 コーパスに情報を付加したコーパス 主なもの (平文コーパス) 品詞タグ付きコーパス 単語の品詞 単語境界 構文構造付きコーパス 文の構文木 文節の係り受け関係 注釈付きコーパス 5 主なもの 語義タグ付きコーパス 単語の語義 パ

  • 1