生成AIとメディア企業の連携ChatGPT等で知られるOpenAIが、世界最大の掲示板サイトであるRedditとの連携を発表した(gihyo.jpの記事)。アナウンスには「OpenAIはRedditのデータAPIにアクセスし、Redditからリアルタイムで構造化されたユニークなコンテンツを獲得します」とあるので、Redditへの投稿を大々的に学習対象とするということのようである。 生成AIの性能改善で鍵となるのは学習データだが、最近ではトレーニングに使えるデータが枯渇しつつある。人間にとってはウィキペディアやワールド・ワイド・ウェブはとうてい汲み尽くせない広大な知の海だが、それでもAIは学び尽くしてしまったのだ。そこで目が向くのが有料コンテンツだが、OpenAIはニューヨーク・タイムズ等にコンテンツの無断使用で訴えられており、そうしたリスクを極力避けるためにもデータの供給源としてメディア企
![自家中毒に陥る生成AI(八田真行) - エキスパート - Yahoo!ニュース](https://cdn-ak-scissors.b.st-hatena.com/image/square/029969b1c8b4a079451967713eb16de64fdf0cdf/height=288;version=1;width=512/https%3A%2F%2Fnewsatcl-pctr.c.yimg.jp%2Ft%2Fiwiz-yn%2Frpr%2Fhattamasayuki%2F01769973%2Ftitle-1715917315189.jpeg%3Fexp%3D10800)