タグ

ブックマーク / datajournalismjp.github.io (5)

  • データ可視化を利用してデータの中の知見を見つける - データ・ジャーナリズム・ハンドブック

    可視化はデータ分析において重要だ。攻撃の最前線であり、他の方法では明らかにすることが難しいであろうデータの複雑な構造を提示してくれる。 データはそれ自体は、コンピュータに保存されているビットやバイトであり、見ることが出来まない。データを見て理解するためには、それを可視化しなければなりません。ここでは広義の意味で 可視化 という言葉を用いる。ここではデータを単にテキストで再現することも含む。例えば、データセットをスプレッドシート・ソフトウェアにロードすることもデータ可視化と見なす。見ることができないデータが突然スクリーン上に見える"絵"になるのだ。よって、問題はジャーナリストがデータを可視化するか否かではなく、状況に応じてどのような可視化が適しているのかが重要なのである。 言い換えれば、表をつくる以上の可視化が有用なのはいつだろうか?端的な答えは、ほとんどいつもである。表それ自体はデータセッ

  • データ・ジャーナリスト達のお気に入りのツール - データ・ジャーナリズム・ハンドブック

    プシュー。これは、あなたのデータが密閉容器から漏れ出す音だ。さて、どうする?何を探す?どんなツールを使う?我々はデータ・ジャーナリスト達に彼らがどうやってデータを処理しているのか教えてくれるように頼んだ。ここに彼らの答えがある: ガーディアン・データブログでは、読者とのインタラクションを好み、彼らに我々のデータジャーナリズムを素早く再現できるようにして、読者達が私たちの成果を基に何かを作ったり、時には我々が理解できなかった事を理解したりするようにしている。だから、データ・ツールは直感的であるほど良い。我々は、誰もがプログラミング言語の習得や特別なトレーニング、高額な費用なしにこつをつかむ事が出来るツールを選んでいる。 このために、私たちはGoogleの製品を非常に良く使っている。我々が整理して公開するデータセットは全てGoogle Spreadsheetで提供していて、Googleアカウン

  • ウェブからデータを得る - データ・ジャーナリズム・ハンドブック

    もしあなたがあらゆる方法を試行してみたものの、データにまだ手が届かずにいる。またはウェブ上にデータは見つかったものの、悲しいかな、ダウンロード可能でなかったり、コピー&ペーストできない状態だったとする。大丈夫、そこからデータを取り出す方法はまだあるかもしれない。例えば次のような手段がありえる: WebベースのAPI経由でデータを取得する。オンラインデータベースやモダンなWebアプリケーション(Twitter、Facebookなど多数ある)がインターフェースを提供している場合がある。ソーシャルメディアサイトと同様、政府が公開するデータや商用データにアクセスする有力な方法である。 PDFファイルからデータを抽出する。この方法は難しい。PDFはもともとプリンタ向けの言語であり、文書に含まれるデータ構造のための情報を多く持てないためである。PDFファイルからの情報抽出は書で扱う範囲外ではあるが、

  • 5分でわかるフィールド・ガイド - データ・ジャーナリズム・ハンドブック

    いつも見つけやすいとは限らないが、ウェブ上の多くのデータベースは、公開した人が意図したかしていないかに関わらずサーチエンジンにインデックスされている。それを探すためのいくつかのヒントを紹介しよう。 データを探すときは、あなたの探したい内容に関連する検索用語はもちろん、フォーマットの情報やデータがありそうな情報源に関する情報も考慮するように心がけるべきだ。Googleや他のサーチエンジンはファイルタイプでの検索ができるようになっている。例えば、スプレッドシートだけを検索する場合は、検索クエリに「filetype:XLS filetype:CSV」を追加すればいい。同様に、地図データには「filetype:shp」、データベースから抽出されたデータには「filetype:MDB, filetype:SQL, filetype:DB」を追加する。PDFファイルだけを探すことだって、その気になれ

  • ようこそ - データ・ジャーナリズム・ハンドブック

    このデータ・ジャーナリズム・ハンドブックは、クリエイティブコモンズ 表示-継承 (CC BY-SA) ライセンスの下で、自由に複製、再配布、再利用できる。作成に貢献した方々はその素晴らしい貢献について著作権を保持する一方、親切にもこのライセンスの下での公開に同意してくれた。

  • 1