JaLC IRDB Crossref DataCite NDL NDL-Digital RUDA JDCat NINJAL CiNii Articles CiNii Books CiNii Dissertations DBpedia Nikkei BP KAKEN Integbio MDR PubMed LSDB Archive 極地研ADS 極地研学術DB 公共データカタログ ムーンショット型研究開発事業
春野 雅彦 ATR人間情報通信研究所 白井 諭 大山 芳史 NTTコミュニケーション科学研究所 フロントページへ戻る 本稿ではコーパスから決定木を構成し日本語係り受け解析に利用する方法を 述べる。一般に日本語係り受け解析では2文節間の係り易さを数値で表現し、 その数値を1文全体で最適化することによって係り受け関係を決定する。 したがって日本語係り受け解析は2文節間の係り易さを正確に計算するこ とに帰着する。本研究の主旨は2文節の係り易さの評価と必要な属性の自動選 択に決定木を利用することである。これまでに英語、日本語で行われた統計 的依存解析の研究では、文節の種類によらず予め決められた属性すべてを使った 条件付き確率で係り易さを評価してきた。 一方、決定木を利用する手法では係り受け関係にある文節とそうでない 文節を弁別する属性が、2文節の種類に応じて重要な順にしかも必要な数だけ 選択される
ChaSen 品詞体系 (IPA品詞体系) ChaSen の品詞体系は任意の階層化を許している。 いわゆる形容動詞は名詞の形容動詞語幹として含まれ、 形容詞には含まれない。Juman の指示詞という カテゴリは「連体詞」に含まれている。 判定詞「だ」は助動詞とされている。 Type1 Type2 Type3 Type4 Examples Description
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く