タグ

ブックマーク / note.com/kazukio (3)

  • 「信頼できないデータ」をいかに可視化するか|荻原 和樹 / Kazuki OGIWARA

    新型コロナウイルス感染症(COVID-19)のデータをビジュアライズするにあたっては、信頼できないデータの扱いに頭を悩まされている。 ここで信頼できないデータとは改竄とか隠蔽という意味ではなく、定義が頻繁に変わったり、事象の発生と公表日にタイムラグがあったり、時系列での継続性が担保できないデータを指す。 そもそも厚生労働省から発表されるCOVID-19のデータは、基的に時系列ではなくその日時点で判明している累計数字だけだ。 (厚生労働省「新型コロナウイルス感染症の現在の状況と厚生労働省の対応について(令和2年5月16日版)」より)過去分の訂正は行われず、新たに判明した追加や訂正があると最新の数字だけが変更される(いちおう注記にはその旨が書かれるが、結局いつ・どのくらい訂正されたかが書いていないので過去データの修正ができない)。したがって、時系列で見るとマイナスになるはずのない項目がマイナ

    「信頼できないデータ」をいかに可視化するか|荻原 和樹 / Kazuki OGIWARA
  • 表の数字は等幅フォントになっているか - データ可視化ミニ講座(6)|荻原 和樹 / Kazuki OGIWARA

    データを表形式で表すときは、数字のフォントがモノスペース(等幅)になっているか確認するとよいでしょう。 モノスペースとは、数字や英字の幅が文字によらず一定である種類のフォントを指します。たとえば細長い「1」でも比較的幅の広い「8」でも同じ字幅となるのがモノスペースフォントです。表の数字をモノスペースで表すことによって、上下の行と桁数を比較するときに「桁数」と「見た目の幅」が視覚的に一致します。 逆に、文字によって幅が異なるフォントをプロポーショナルフォントといいます。可変幅フォントとも呼ばれます。「i」や「l」など細長い文字は細く、「G」「M」のように太い文字は太く表示されます。文字の幅はそれぞれなので、文章などを表示する際にはプロポーショナルフォントを使うのが読みやすいですが、上下の行と比較されることがある数字をプロポーショナルフォントで表示すると、実際の桁数と見た目の幅が一致しません。

    表の数字は等幅フォントになっているか - データ可視化ミニ講座(6)|荻原 和樹 / Kazuki OGIWARA
  • データ可視化・データ報道の最新情報を入手する方法|荻原 和樹 / Kazuki OGIWARA

    先月末の報道実務家フォーラムにて登壇した際、「データ可視化やデータ報道に関する情報収集はどうしているか」という質問がありました。その場でもお答えしましたが、改めて考えると色々や手段があるなと思ったので目的や形態別に分けて整理したいと思います。 Data Visualization Society会場でも答えたのがData Visualization Societyというデータ可視化のコミュニティです。非営利団体が運営しており、Slack channelや各種の調査などを運営しています。 特にThis Week in Data Vizという週に1度届くNewsletterは、その週に発表された報道分野の特筆すべき作品、データ可視化関連のイベント予定、求人情報などを網羅しています。 Top 10 in Data Journalism調査報道に携わるジャーナリストの団体であるGIJN(Globa

    データ可視化・データ報道の最新情報を入手する方法|荻原 和樹 / Kazuki OGIWARA
  • 1