タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

hbaseに関するsjnのブックマーク (1)

  • HBase - HBase でのバルクロード

    概要 HBase では、さまざまな方法でデータをテーブルにロードすることができます。最も簡単な方法は、MapReduce ジョブから TableOutputFormat クラスを使うか、または通常のクライアント API を使う方法ですが、これらの方法は必ずしも最も効率的な方法ではありません。 ここでは、HBase のバルクロード機能について説明します。バルクロード機能は、MapReduce ジョブを使って、HBase の内部データ形式でテーブルデータを出力してから、実行中のクラスタにデータファイルを直接ロードします。バルクロードを使うと、HBase API を使う場合よりも、CPU とネットワークの負荷を低く抑えることができます。 MapReduce ジョブによるデータの準備 バルクロードの最初のステップでは、HFileOutputFormat を使って MapReduce ジョブから H

  • 1