リクルートは2019年4月2日、Python向け日本語自然言語処理ライブラリ「GiNZA(ギンザ)」をオープンソースソフトとして公開したと発表した。1.0.1版では新元号「令和」にも対応した。 公開したのは同社のAI(人工知能)研究機関であるMegagon Labs。同ライブラリでは、国立国語研究所との共同研究成果の学習モデルを用いた。 GiNZAは、Python向けの自然言語処理ライブラリ「spaCy」をフレームワークとして利用し、オープンソースの形態素解析器「Sudachi」のPython版である「SudachiPy」を内部に組み込んだ。 import spacy nlp = spacy.load('ja_ginza_nopn') doc = nlp('依存構造解析の実験を行っています。') for sent in doc.sents: for token in sent: print