タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

treasuredataに関するhiroyukimのブックマーク (2)

  • トレジャーデータUDFで効率の良いクエリを実現する - Date Function 編 - - トレジャーデータ(Treasure Data)ブログ

    トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 トレジャーデータサービスは,スタンダードプランとしてバッチクエリであるHive, Pigをサポートしています。また,プレミアムプランまたはオプション追加によってアドホッククエリであるTQA(Backend: Presto)をサポートしています。 Treasure Data Hive UDF 無尽蔵の列指向データベースであるトレジャーデータのストレージですが,特に時系列データに対しては強力なパフォーマンスを発揮します。今回はその理由と,パフォーマンスを出すためのクエリの記述方法をご紹介します。 TDS バックエンドアーキテクチャ概略 トレジャーデータサービスでは,Realtime Storage と Archive Storage の二種類のストレージを利用しています。Treasure Agent (Fluentd)

    トレジャーデータUDFで効率の良いクエリを実現する - Date Function 編 - - トレジャーデータ(Treasure Data)ブログ
  • Treasure DataのPlazmaDBを理解する - Qiita

    こんにちは。Treasure Dataの斉藤です。出張中に時間ができたのでシアトル空港でこの記事を書いています。日語でブログを書くのはものすごく久しぶりなのですが、Treasure Dataの列志向(columnar)圧縮ストレージであるPlazmaDBについて紹介していきたいと思います。 Treasure Dataでは2014年現在まで5兆(trillion)件を超えるレコードが取り込まれており、一秒あたりでは40万以上(!)のレコードを処理しています。 2013年のTwitterでは1秒あたり5,700 tweets処理していたとのことなので、その処理量の大きさが実感できるのではないでしょうか。この量のレコードをそのまま蓄積するのではストレージ量が膨大になってしまいますので、Treasure Dataではレコードを列分解し、MessagePack形式に変換+圧縮処理を施すことでデータ

    Treasure DataのPlazmaDBを理解する - Qiita
  • 1