タグ

software-engineeringとdata-cleansingに関するnabinnoのブックマーク (2)

  • データ匿名化手法

    データがビジネスを駆動する現在、さらなるサービスの進化と利便性を推進するために、個人に関する情報は不可欠です。書は、機微な個人情報を多く含むヘルスデータを題材に、プライバシー保護とデータ有用性という相反する命題をいかに満たすかについて、豊富な実例とともに解説する書籍です。リスクベースの非特定化方法論、横断的データ、縦断的イベントデータ、データリダクション、地理空間の集約、マスキングなどデータの匿名化に必要な事柄を網羅的に解説します。医療者はもちろん、個人のプライバシーを守りつつ、より洗練されたサービスを提供したいエンジニア、データ技術者必携の一冊です。 監訳者まえがき まえがき 1章 イントロダクション 1.1 匿名化すべきか、せざるべきか 1.1.1 同意を得るか、匿名化するか 1.1.2 お金節約する 1.1.3 人目に触れたくない 1.2 匿名化における2の柱 1.2.1 マス

    データ匿名化手法
  • データ品質 - Wikipedia

    データ品質(英: Data quality)は、データの品質である。データが高品質であるとは「オペレーション、意思決定、計画などの目的に適っていること」を指す(J.M. Juran)。これとは別に、実世界の対応実体を正しく表しているデータを高品質とする見方もある。これら2つの見方は、同じ目的の同じデータに対しても必ずしも一致しない。 データ品質とは、データが実際の現象をどれだけうまく表しているかの尺度である[1]。 データを特定の用途に適したものとする完全性、妥当性、一貫性、適時性、正確性[2]。 特定用途を満たす能力に影響するデータの機能と特徴の総体。データと関連した要因の優秀さの尺度の総計[3]。 低価格のサーバが普及する以前、データの管理はメインフレームで行われていた。例えば、顧客の名前と住所のデータは、誤字脱字の修正、引越し・死亡・服役・結婚離婚といった人生の大きな出来事に関わる

    データ品質 - Wikipedia
  • 1