私(安岡孝一)の昨日の日記に対して、GiNZA v4.0.0にはginza.bunsetu_spansという関数があって、spaCyのSpanとして文節を取り出せる、との情報をいただいた。素晴らしい。GiNZAにdeplacyを併用して、単語間の係り受けと文節間の係り受けを解析してみよう。まずはインストール。 $ python3 >>> import spacy >>> ja=spacy.load("ja_ginza") >>> doc=ja("国境の長いトンネルを抜けると雪国であった。") >>> import deplacy >>> deplacy.render(doc,Japanese=True) 国境 NOUN ═╗<══╗ nmod(体言による連体修飾語) の ADP <╝ ║ case(格表示) 長い ADJ