こんにちは、横須賀市生成AI推進チームのM田です。 横須賀市がChatGPTを全庁利用を始めて1年経ちましたが、現在、いよいよ市民向けのAIサービスの実現に向けて相談AIチャットボットの実証実験をはじめたところです。 既に多くの人から話しかけてもらっていて、想定したよりも多くのアクセスがあったため一時停止するトラブルもありました…。 (現在は動いています) 今回は、この「ニャンぺい」を公開するにあたって、内部で行うテストをChatGPT(GPT-4o)とPythonプログラムを使って超効率化したよ、という話です。 AIチャットボットのテストAIチャットボットを作るにあたって、チャットボットの挙動(望んだ返答をしているか)のチェックをするテストは欠かせません。 テストは、まず複数のシナリオを作り、チャットボットへ質問し、回答を採点します。そして、採点結果をもとにチャットボットを修正して、再度
![AIチャットボット「ニャンぺい」のテストをPython×GPT-4oで自動化する!|自治体AI活用マガジン(運営:横須賀市)](https://cdn-ak-scissors.b.st-hatena.com/image/square/95766d465390b5da9c22e4afade9f7f46aaae872/height=288;version=1;width=512/https%3A%2F%2Fassets.st-note.com%2Fproduction%2Fuploads%2Fimages%2F141556268%2Frectangle_large_type_2_7bb83657dad343bc767ec07e2bdfa576.png%3Ffit%3Dbounds%26quality%3D85%26width%3D1280)