はじめに 昨今、OpenAI ChatGPTやAnthropic Claudeをはじめとした高品質な対話型APIが公開されています。 これらの対話型APIの応用の一つとして音声会話が挙げられますが、音声まで返してくれる対話型APIは現状ほとんどなく、ユーザが各自で音声認識・音声合成用のシステムまたはAPIと接続する必要があります。本記事では、OpenAI GPT-4o APIを弊社の提供している音声合成サービスKoemotionと接続し、ユーザからのテキスト入力に対して音声で高速に応答するシステムを作っていきます。 実際に作ってみたものがこちら。 KoemotionのAPIキーの取得 Koemotionの登録・APIキーの取得方法に記載された方法に従ってKoemotionに登録し、APIキーを取得します。Koemotionでは個人利用にあたってKoemotion Trial, Koemot