議論とデータ新型コロナウイルスの対応について、日本中で議論が巻き起こっています。曰く、検査数は増やすべきか否か、日本の実際の感染者数がどれぐらいなのか、いつごろ収束するのか、他国より対策がうまくいっているのか否か、全国一斉休校に意味があるのかなどなど。そうした議論は民主主義国家として望ましいものですが、しかし生産的な議論を行うためには、まず共有可能で信頼できるデータが必要不可欠です。 データ分析の世界ではgarbage in, garbage out「ゴミを入力すれば、ゴミしか出力しない」と、よく言われます。有意義な分析をするためには、最低限、データがまともである必要があります。まともなデータとは、最低限、正しいデータ入力と、論理的整合性が必要です。だからデータアナリストは、分析の前に必ずデータの整合性を検討し、矛盾のないカテゴリ体系を設計し、データの整備に過半の力を注ぐのです。 厚労省デ