大規模言語モデル「LLaMA」を開発するMetaは、2023年7月に「著作権で保護された書籍を用いてAIをトレーニングしている」として提訴されています。この裁判で新たに、Metaが海賊版電子書籍ライブラリのZ-LibraryやAnna’s Archiveなどに保存された約81.7TB分のデータを用いてLLaMAのトレーニングを行ったという証拠が提示されました。 Kadrey-v-Meta-Motion-for-Relief-Appendix-A-2-5-25.pdf (PDFファイル)https://cdn.arstechnica.net/wp-content/uploads/2025/02/Kadrey-v-Meta-Motion-for-Relief-Appendix-A-2-5-25.pdf “Torrenting from a corporate laptop doesn’t fe
![Metaが海賊版コンテンツを含む81.7TB分のデータでAIをトレーニングしていたことが明らかに](https://cdn-ak-scissors.b.st-hatena.com/image/square/96a6649cbcc161981567a0af486262daa5ea94be/height=288;version=1;width=512/https%3A%2F%2Fi.gzn.jp%2Fimg%2F2025%2F02%2F10%2Fmeta-training-torrent%2F00.jpg)