先日、ミルクボーイのネタでGPT-3をファインチューニングしてみた (1) ~入門編~ - QiitaでGPT-3のファインチューニングに挑戦してみたのですが、内海さんの口調っぽくなっていたものの、全く会話が成り立っていませんでした。 今回は訓練データの形式を見直して改善されるかを試してみます。 何がダメだったか 以下が以前の訓練データです。 {"prompt": "うちのオカンがね 好きな朝ごはんがあるらしいんやけど その名前をちょっと忘れたらしくてね" "completion": "朝ごはんの名前忘れてもうて どうなってんねんそれ"}, {"prompt": "色々聞くんやけどな 全然分からへんねんな" "completion": "分からへんの? いや ほな俺がね おかんの好きな朝ごはん ちょっと一緒に考えてあげるから どんな特徴ゆうてたかってのを教えてみてよ"} それぞれのデータが