エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
スタンフォード大学はいかにしてLAION-5Bから1008件のCSAMを検出したか - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
スタンフォード大学はいかにしてLAION-5Bから1008件のCSAMを検出したか - Qiita
概要 2023年12月20日、Stable Diffusionなどの有名な画像生成AIが学習に利用しているオープンデータセッ... 概要 2023年12月20日、Stable Diffusionなどの有名な画像生成AIが学習に利用しているオープンデータセットであるLAION-5Bに1008件のCSAM(Child Sexual Abuse Material: 児童性的虐待画像)が含まれていることがStanford Internet Observatoryによって指摘されニュースとなりました。この記事では公開された以下の調査レポートを基に、50億を超えるテキスト画像ベアのLAION-5BからどのようにしてCSAMを特定したのかをまとめました。 背景 LAION-5Bとは かつての画像データセットは人力で収集・厳選した画像に人力でアノテーションを付与していましたが、近年はインターネットのクローリングと自動処理によって億を超えるサンプルを持つデータセットが登場しています。LAION-5Bもその一つで、毎月数十億のページをクロ