分散表現は、単語をベクトルで表現する自然言語処理領域のAI技術の1つで、大量のテキストデータからさまざまな単語の関係性を機械学習して、単語同士の意味の相違を機械的に推定でき、同社はユーザーの興味関心情報と記事や広告のマッチングに活用している。 より大量のテキストデータを用いて学習することで、精度向上が期待される一方で、インターネットサービス上のテキストデータを活用する場合は分散表現の学習モデルを頻繁に更新する必要があり、その際には新しいデータとともに、すでに学習したデータもあわせて最初から学習し直す必要があるため、その都度学習時間がかかるなど、非効率だった。 「yskip」は、こうした課題を解決すべく、代表的な分散表現学習法である「skip-gram model with negative sampling(SGNS)」を拡張して開発されており、新たなデータのみの学習で全データを学習する場