2. あらまし の あらまし • パーソナルデータのデータベースは 個人ID+多数の属性値 というレコードからなります。 • 属性値には購買した品物、特定の場所の滞在履歴や移動履歴、評 価した商品(映画など)があります。 • 個人IDを消して匿名化していても、少数の属性値が攻撃 者に知られるだけで、個人識別ができてしまいます。 • 稀(rare)な属性値が知られると非常に危険です。 • こういった直感をモデル化して数量的に評価した話です。 3. • Netflixの映画評価データベースを使った公開タスク事件: Narayanan, A., Shmatikov, V. (2008) Robust De-anonymization of Large Sparse Datasets, Proc. of the 2008 IEEE Symposium on Security and Priva
2. 「世界最先端IT 国家創造宣言について」 平成25 年6 月14 日閣議決定(抜粋) • 個人情報やプライバシー保護に配慮したパーソナルデータの利 活用のルールを明確化した上で、個人情報保護ガイドラインの 見直し、同意取得手続の標準化等の取組を年内できるだけ早 期に着手 ところが、ショーンベルガー&クキエ等の「ビッグデータの正体」8,9 章によれば、将来サービスの予見は無理である以上、同意取得 じゃダメ。サービス提供側に責任を持たせる法体系を提案 • さらに、2014 年以降に、制度見直し方針に示されたロードマップ に従って、国際的な連携にも配慮しつつ、順次パーソナルデー タ利活用環境を整備し、利活用を推進する。 4. 匿名化の弱点:link attack • Sweeney [S02a] によれば、Massachussetts州知事の医 療記録が公開情報から特定可能 – MA では
