はじめに おはようございます。こんにちは。こんばんは。 GMOアドマーケティングのY-Kです。 前にBERTを使って文をベクトルに変換してからなんやかんやする記事を書いてから約半年が経過したのですが、その間にChatGPTが大きく流行り、言語生成系AIに大きな風が吹きました。 というわけで今回は、OpenAIのEmbeddings APIを利用し、記事タイトルの類似度を見てみようと思います。 準備 今回も例のごとくGoogle Colab上で行います。 https://colab.research.google.com/?hl=ja OpenAIのEmbeddings APIを利用できる様にAPIキーは事前に取得しておいてください。 まずは必要なライブラリを使えるようにします。
![OpenAIのEmbeddings APIを使って文の意味上の類似度を計算](https://cdn-ak-scissors.b.st-hatena.com/image/square/83b9f94773f6b58e30947c3eeb750f44b7b7317d/height=288;version=1;width=512/https%3A%2F%2Ftechblog.gmo-ap.jp%2Fwp-content%2Fuploads%2F2023%2F05%2Fa7501472a6e08edb0b2d1e8ef23e090f.png)