先日、タイトルの件についてRTAをしました。 その結果、だいたい2時間くらいで以下のようなChatGPT+3Dモデル対話エージェントが完成しました。 RTAではユーザーの話しかけに対する反応速度が遅くなっていたり(長文の読み上げ音声の生成&ダウンロードに時間がかかっている)、そもそも2時間って結構大変だなーみたいなのがあるので、基本的に"Out-of-the-Box"で動くサンプルを公開しました。 この記事ではChatGPTとおしゃべりするまでの手順と、その次に進みたい(自らもっとカスタマイズしたい)方向けのTipsを説明したいと思います。 音声認識・音声合成・ChatGPTのAPIKeyの取得 まずはAPI Keyの類を準備します。音声認識・音声合成としてGoogle / Azure / Watsonのいずれかを準備してください。 Google Azure Watson サービスにより設