画像生成AIは法的・倫理的に激しい議論の対象となっていますが、その論点の1つが学習に使われる膨大なデータセットです。AIの学習に用いられるデータセットにはインターネットで収集された画像も多く含まれており、著作権の問題がクリアになっていないことが問題視されています。Stable Diffusionのような潜在拡散モデルの画像生成AIで、トレーニングに用いられたデータセットに含まれる画像をほぼそのまま生成することに成功したという論文を、Google・DeepMind・カリフォルニア大学バークレー校・プリンストン大学・チューリッヒ工科大学の研究者グループが発表しました。 [2301.13188] Extracting Training Data from Diffusion Models https://arxiv.org/abs/2301.13188 Paper: Stable Diffusi
![Stable Diffusionなどの画像生成AIは「記憶」に基づいて学習した画像をほぼそのまま生成できるという報告](https://cdn-ak-scissors.b.st-hatena.com/image/square/9b4951e35f7bb5eaa5e584fcd803130fea2a15d6/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2023%2F02%2F02%2Fstable-diffusion-memorizes-images%2F00.png)