ブックマーク / note.com/ishtarist (1)

  • 厚労省・新型コロナ陽性者データに内在する不可解な矛盾|馬の眼 ishtarist

    議論とデータ新型コロナウイルスの対応について、日中で議論が巻き起こっています。曰く、検査数は増やすべきか否か、日の実際の感染者数がどれぐらいなのか、いつごろ収束するのか、他国より対策がうまくいっているのか否か、全国一斉休校に意味があるのかなどなど。そうした議論は民主主義国家として望ましいものですが、しかし生産的な議論を行うためには、まず共有可能で信頼できるデータが必要不可欠です。 データ分析の世界ではgarbage in, garbage out「ゴミを入力すれば、ゴミしか出力しない」と、よく言われます。有意義な分析をするためには、最低限、データがまともである必要があります。まともなデータとは、最低限、正しいデータ入力と、論理的整合性が必要です。だからデータアナリストは、分析の前に必ずデータの整合性を検討し、矛盾のないカテゴリ体系を設計し、データの整備に過半の力を注ぐのです。 厚労省デ

    厚労省・新型コロナ陽性者データに内在する不可解な矛盾|馬の眼 ishtarist
    nuara
    nuara 2020/03/20
    間違いにはいろいろ理由はあるだろうけど、政策決定の根拠になる数字なんだから、その時々で綺麗にした時系列データ改訂版を出さなきゃだめでしょう。
  • 1