「ChatGPT」が瞬く間にセンセーションを巻き起こした状況で、次の2つが起きるのは時間の問題だった。生成人工知能(AI)の利用が本格的な研究対象になることと、生成AIの利用が生成AI自体のトレーニングに役立てられることだ。 9月にarXiv(査読なしのオープンアクセスジャーナル)に掲載された論文によると、研究者らは25言語の大規模言語モデル(LLM)を使い、人々が交わした会話100万件を収集してデータベース化したという。論文の執筆陣には、カリフォルニア大学バークレー校のLianmin Zheng氏のほか、カリフォルニア大学サンディエゴ校、カーネギーメロン大学、スタンフォード大学、アラブ首長国連邦(UAE)のアブダビにあるモハメド・ビン・ザイード人工知能大学の研究者らが名を連ねている。 データベースから無作為に抽出された会話10万件を話題別に分類したところ、大半が容易に予想されるものだった