安野たかひろ事務所 技術チームの角野です。前回の投稿ではAIあんのにおける返答生成技術の詳細に触れましたが、今回は返答生成に用いるデータの整備に焦点を当てて解説します。 なぜデータの整備が必要なのか?AIあんのでは政策に関する質問に対してLLMで返答の生成を行っていますが、元のLLMには安野の政策に関する知識が含まれておらず、そのままでは政策に関する質問には回答できません。 そこで、前回の記事でも解説しましたが、AIあんのではLLMに入力するプロンプト中に政策に関する知識を注入することで、政策に関する質問に回答できるようにしています。当然知識がない質問に対しては回答できないため、ユーザーの質問に対して正確に回答するには政策に関する知識をデータとして整備することが重要となります。 返答生成に利用しているデータAIあんのでは、次の2種類のデータを返答生成時に利用しています。 今回の記事では、私
![【都知事選×テクノロジー】東京都知事選におけるHuman-in-the-Loop機械学習|NSK](https://cdn-ak-scissors.b.st-hatena.com/image/square/423fb9bf0df6696fd27ba3437f0d19c2373a9812/height=288;version=1;width=512/https%3A%2F%2Fassets.st-note.com%2Fproduction%2Fuploads%2Fimages%2F146386554%2Frectangle_large_type_2_3b9fe75e7713bd8d6f7329cf7fc0410c.png%3Ffit%3Dbounds%26quality%3D85%26width%3D1280)