SpaCyは、数年前からエンティティ抽出プロジェクトを立ち上げようとするすべての企業にとってデファクトスタンダードとなっています。何がspaCyをこれほどまでに普及させたのでしょうか?また、2023年にエンティティ抽出プロジェクトを始めようとする人にとって、spaCyの良い代替品はあるのでしょうか?この記事では、これらの点について議論してみましょう。 SpaCy エンティティ抽出用 2015年にspaCyの最初のバージョンがリリースされ、瞬く間にエンタープライズグレードのエンティティ抽出(NERとも呼ばれる)の標準フレームワークとなった。 構造化されていないテキスト(例えばウェブからのもの)があり、そこから日付、名前、場所などの構造化されたデータを抽出したい場合、spaCyは非常に良いソリューションです。 SpaCyが面白いのは、約20の言語に対応した学習済みモデルがいくつか用意されている