構文解析に関するgengohouseのブックマーク (2)

  • DiaParserの日本語係り受け解析をGoogle Colaboratoryで動かす | yasuokaの日記 | スラド

    ネットサーフィンしていたところ、DiaParserという係り受け解析ツールを見つけた。Transformers上で、22の言語の係り受け解析をおこなえるらしいが、品詞付与をおこなわずに、元の文に対してダイレクトに係り受け解析をおこなうようだ。とりあえず、DiaParserの日語モデルを、Google Colaboratory上でdeplacyに繋いでみよう。 !pip install deplacy diaparser fugashi unidic-lite ipadic from transformers.tokenization_bert_japanese import MecabTokenizer tokenizer=MecabTokenizer(mecab_dic="unidic_lite") from diaparser.parsers import Parser parser

  • 自然言語処理のステップ③:「構文解析」とは?

    単語間の係り受け関係をはっきりさせるのが、構文解析! 構文解析(こうぶんかいせき)とは、構文を明らかにする作業です。 構文とは、「文章の構造、文章の組み立て」(三省堂 大辞林 第三版)のことで、形態素解析で得られた単語間の関係性を明らかにすることで、ある文の構文を把握しようというのが構文解析です。 具体的には、構文解析は、単語間の「係り受け関係」(どの語がどの語を修飾、補足、接続等しているかの関係性)を明らかにします。 機械学習の現場では、自然言語処理を実行するときの第三のステップとして、形態素解析の次に構文解析を行います。 自然言語処理って? 自然言語処理というのは、人間の言語である「自然言語」をコンピュータで分析するための処理のことです。 漢字にするといかめしいですが、今ここで読んでいる「この文字」や「あの文字」も、"Thank you!"も全て、自然言語です。 👉参考記事:『自然言

  • 1