タグ

ブックマーク / qiita.com/Salinger (1)

  • Fluentd + BigQuery による Tweet データ収集 - Qiita

    はじめに 今回は、Twitter Streaming API で得られる全ツイート中の 1% の 日語 Tweet のデータをログとして収集し、 Fluentd を用いて、BigQuery に格納するシステムを構築する。 以下に BigQuery と Fluentd を説明を記載する。 BigQuery とは Google BigQuery とは、クラウド上で動作するデータウェアハウス。 以下の様な特徴を持っている。 テラバイト級のデータに対しても、高速に集計が可能。 ストレージ料金が安い (容量あたりの保存単価だとAWS S3 よりも安価) データのインポートが容易 (バルクアップロード / ストリーム)。 細かい話は次のリンクを参照。 Googleの虎の子「BigQuery」をFluentdユーザーが使わない理由がなくなった理由 #gcpja ありとあらゆるログデータを格納する先とし

    Fluentd + BigQuery による Tweet データ収集 - Qiita
  • 1