タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

corpusに関するmono-hateのブックマーク (2)

  • KWDLC - LANGUAGE MEDIA PROCESSING LAB

    京都大学ウェブ文書リードコーパス † コーパスは、さまざまなウェブ文書のリード(冒頭)3文に各種言語情報を人手で付与したテキストコーパスです。ウェブ文書のリード3文を収集することによって、ニュース記事、百科事典記事、ブログ、商用ページなど多様なジャンル、文体の文書を含んでいます。コーパスの規模は約5,000文書です。 言語情報としては、形態素・固有表現・構文・格関係、照応・省略関係、共参照、談話関係の情報を付与しています。言語情報の付与は、形態素解析システムJUMAN、構文・格・照応解析システムKNPで自動解析し、その結果を専門家が修正することによって行いました。談話関係については、専門家によって付与した小規模なコーパスに加え、クラウドソーシングによって付与した大規模なコーパスが含まれます。 ↑

  • サイトポリシー | オープンイノベーション推進本部

    語 ENGLISH

  • 1