タグ

corpusとcompoundに関するfubaのブックマーク (1)

  • MUST1: 日本語複合辞用例データベース v1.0

    MUST1とは 日語には、複数の形態素がひとまとまりとなって、ひとつの機能語相当語として働く表現が、数多く存在します。 このような表現は、一般に複合辞と呼ばれます。 日語複合辞用例データベース v1.0(以下では、MUST1と呼びます)は、複合辞の機械処理を研究するための基礎データを提供することを目的として設計・編纂したデータベースです。 - マニュアル(PDF) MUST1の構成 MUST1は、項目の集合(全125項目)として構成されています。 項目は、一つの複合辞(見出し語)に対するデータの総体を表します。 見出し語集合は、国立国語研究所編の『現代語複合辞用例集』に完全に準拠しています。 一つの項目は、複数の小項目から構成されています(全337小項目)。 小項目は、一つの見出し語を表記等に着目して細分化した小見出し語に対するデータの総体を表します。 各小項目には、最大50件の用例デ

  • 1