エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Hadoop/HiveでTPC-H
「Peta Byteを超えるデータ量をスキャンする」のに1台のサーバでは無理がある。 だから、Hadoopというこ... 「Peta Byteを超えるデータ量をスキャンする」のに1台のサーバでは無理がある。 だから、Hadoopということになる。でも「100台のサーバを揃えてテストをする」なんて趣味の範囲を超えてしまうのでできない。 取りあえず、以下の構成4台で、データ量も32GBにしてOracleと比較してみる。 OSもCentOS 5.5 (x86-64)にして、今回使っているAMD Phenom II X6 1100T Black Edition BOX(3.3 GHz/6 core)1台でDOP=6のOracleのパフォーマンスを見てみると: このブログでずっとやってきた事だけど、Parallel QueryにはCompressやPartitioningが効果がある。 でもTPC-Hのデータの「質」がPartitioning向きであっただけで、Partitioningなどできないパターンも数多く存在す