2021年3月15日のブックマーク (2件)

  • spaCyでどこに行きたいか「場所」を抽出する【自然言語処理, Python】 - Yunix Blog

    目次 spaCyで「場所」を抽出する スクリプトの動作結果 スクリプトの設計 スクリプトのソースコード ソースコードの解説 必要モジュールのインポート GiNZAモデルのロード Analyzerクラスの作成 analyze()メソッドで解析を行う analyze_go_to()で「行く」「向かう」を解析する analyze_go()で文脈からトークンを見つける find_from_children()で子要素からトークンを探す find_from_head()で親要素からトークンを探す テストケースを書く おわりに spaCyで「場所」を抽出する 私たちが使う日語は「自然言語」と呼ばれます。 この自然言語をプログラム的に解析するのが「自然言語処理」です。 Pythonにはいくつか自然言語処理を行えるライブラリがあります。 spaCy(スパイシー)のその中の1つです。 spaCy · In

    spaCyでどこに行きたいか「場所」を抽出する【自然言語処理, Python】 - Yunix Blog
  • 株式会社レトリバ

    2021.3.15 レトリバと国立国語研究所の共同研究成果 「日語話し言葉コーパス(CSJ)を用いた日語話し言葉BERT」を公開 コールセンターの音声認識結果を使用した対話要約などの精度向上に貢献 株式会社レトリバ(社:東京都新宿区、代表取締役 河原一哉、以下レトリバ)は、このたび大学共同利用機関法人人間文化研究機構国立国語研究所(以下国語研)との共同研究成果の「日語話し言葉コーパス(Corpus of Spontaneous Japanese、以下CSJ) ※1 を用いた 日語話し言葉BERT」※2を新たに公開します。 近年、自然言語処理の分野ではBERT(Bidirectional Encoder Representations from Transformers)と呼ばれる事前学習モデルが盛んに研究されています。 日語では、WikipediaデータやSNSデータを事前学習

    株式会社レトリバ