ブックマーク / note.com/kazukio (1)

  • 「信頼できないデータ」をいかに可視化するか|荻原 和樹 / Kazuki OGIWARA

    新型コロナウイルス感染症(COVID-19)のデータをビジュアライズするにあたっては、信頼できないデータの扱いに頭を悩まされている。 ここで信頼できないデータとは改竄とか隠蔽という意味ではなく、定義が頻繁に変わったり、事象の発生と公表日にタイムラグがあったり、時系列での継続性が担保できないデータを指す。 そもそも厚生労働省から発表されるCOVID-19のデータは、基的に時系列ではなくその日時点で判明している累計数字だけだ。 (厚生労働省「新型コロナウイルス感染症の現在の状況と厚生労働省の対応について(令和2年5月16日版)」より)過去分の訂正は行われず、新たに判明した追加や訂正があると最新の数字だけが変更される(いちおう注記にはその旨が書かれるが、結局いつ・どのくらい訂正されたかが書いていないので過去データの修正ができない)。したがって、時系列で見るとマイナスになるはずのない項目がマイナ

    「信頼できないデータ」をいかに可視化するか|荻原 和樹 / Kazuki OGIWARA
    enya_r
    enya_r 2020/05/17
  • 1