タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

benchmarkとTreasure Dataに関するyassのブックマーク (1)

  • Treasure Dataでの大容量データベンチマーク - Qiita

    あふれるデータ 会社で、Treasure Dataを使った分析システムを作っている。ゲーム情報を収集して、ユーザーの体験向上に役立てるためだ。そのため、ユーザーの行動を細かく把握する必要がある。勢いデータ容量は増えてしまう。加えて、オンラインのゲームは、パッケージゲームと違い売って終わりではなく、その後何年にも渡って、サービスを提供する。そのため、ユーザーの行動ログは数億件に達することも珍しくない。 Treasure Dataでのログ分析 先に書いたが、大量のログに対応するため、hadoopを利用した問題解決が様々な企業から提供され始めている。タイトルに有るTreasure Dataもその企業の一つだ。こちらからは、ログを送るだけでhadoopやhiveを用いた分析環境を提供してくれる。一方で、こちらが分析機材を用意するわけではないため、どのくらいの速度で分析できるかわからない。特に複雑な

    Treasure Dataでの大容量データベンチマーク - Qiita
    yass
    yass 2013/10/23
    "10億件のデータに対するベンチマークはデータを一千万件ずつ増やしながら100回 / 基本的に、処理時間は線形に増加 / 1億から2億件くらいでは8cpuコア以上は使っていなかったが、その後、件数が増えると32コアcpu使い出した"
  • 1