生成AIとメディア企業の連携ChatGPT等で知られるOpenAIが、世界最大の掲示板サイトであるRedditとの連携を発表した(gihyo.jpの記事)。アナウンスには「OpenAIはRedditのデータAPIにアクセスし、Redditからリアルタイムで構造化されたユニークなコンテンツを獲得します」とあるので、Redditへの投稿を大々的に学習対象とするということのようである。 生成AIの性能改善で鍵となるのは学習データだが、最近ではトレーニングに使えるデータが枯渇しつつある。人間にとってはウィキペディアやワールド・ワイド・ウェブはとうてい汲み尽くせない広大な知の海だが、それでもAIは学び尽くしてしまったのだ。そこで目が向くのが有料コンテンツだが、OpenAIはニューヨーク・タイムズ等にコンテンツの無断使用で訴えられており、そうしたリスクを極力避けるためにもデータの供給源としてメディア企