[B! hbase] somemoのブックマーク

Amazon.co.jp: HBase徹底入門: Hadoopクラスタによる高速データベースの実現: サイバーエージェント: 本

somemo 2015/01/15

hbase
hadoop

リンク

Apache Hadoop YARN: Avoiding 6 Time-Consuming "Gotchas" | Cloudera Developer Blog

ClouderaNOW Learn about the latest innovations in data, analytics, and AI | July 16 Register now

somemo 2014/12/31

hive

リンク

スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w

Cloudera HBase トレーニング: http://tiny.cloudera.com/jptraininghbase Hadoop Conference Japan 2013 Winter で発表した、HBaseのスキーマ設計に関する資料です。 Cloudera の HBase サポート、Cloudera Enterprise RTD http://tiny.cloudera.com/jpcertd

somemo 2014/08/28

hbase
hadoop

リンク

HBaseでdelete後にputしたデータがscanやgetで取得できない件 - 新しいフォルダ (3)

仕事でぶち当たったので備忘録。結論としてはHBaseにおける削除というものの概念を取り違えてただけという悲しい結果だったのですが、同じ轍を踏まないようにエントリに残しておきます。バージョン機能使ってる場合は特に注意したほうがよさそうです。何があったの？以下のコマンドをHBase Shellで実行しました。 # (1) hogehogeテーブルのrowkey1で指定される行のcf:cqカラムのバージョン1000をvalue1で更新 put 'hogehoge', 'rowkey1', 'cf:cq', 'value1', 1000 # (2) 検索 scan 'hogehoge' # (3) hogehogeテーブルのrowkey1で指定される行のcf:cqカラムのバージョン1000を削除 delete 'hogehoge', 'rowkey1', 'cf:cq', 1000 # (

somemo 2014/08/28

hbase

リンク

HBase Hadoopメモ(Hishidama's HBase Hadoop Memo)

S-JIS[2010-07-11/2012-04-28] 変更履歴 HBaseのHadoop関連クラス HBaseにHadoopでアクセスする為のクラス。 WordCountサンプル HBaseのテーブルの全項目を読み込み、単語数を数えるサンプル。出力先はファイル。（通常のHadoopと同じ）（→HBaseのテーブルに出力するWordCount） package jp.hishidama.sample.hbase; import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.conf.Configured; import org.apache.hadoop.fs.Path; impor

somemo 2014/08/25

hadoop
hbase

リンク

HBaseのバルクロードというかHFile生成方法 - wyukawa's diary

HBaseにデータをロードする場合はバルクロードを使うのが性能的には良いと思います。 HTable#putだとWALをオフにしても遅いんですよね。バルクロードに関しては馬本の12.2.3を読むと良いと思います。バルクロードを使うためにはHBase用のデータファイル、HFileを生成する必要があります。 MapReduceジョブでHFileを生成するためには出力フォーマットとしてHFileOutputFormatを使います。 MapReduceジョブを効率的に動作させるためには出力したHFileを1つのリージョンに収まるようにするわけですが、その辺の処理はHFileOutputFormat#configureIncrementalLoadを呼べばいいです。呼べばTotalOrderPartitionerをpartitionerとしてセットしてよろしくやってくれます。 MapReduceで

somemo 2014/08/25

hbase
hadoop

リンク

MapReduceでHBaseへ書き込むときの注意点

せちろー @sechiro HBaseのTableOutputFormatの危険性って、前に見てたautoFlushがFalseになってるからってことかな？ Hadoop Hacksを見ればよいか。単純な追記で使うなら問題ないけど、データの更新みたいな処理だとTaskが落ちた時には戻せないよってことだと予想 2012-04-29 01:33:44

somemo 2014/08/25

hbase
hadoop

リンク

HBaseへデータ投入(importtsvの使い方) - くまくまーZ

create 'sample', 'data' ('a'..'z').each {|i| put 'sample', i, 'data:alpha', i} scan 'samples' ROW COLUMN+CELL a column=data:alpha, timestamp=1333387516755, value=a b column=data:alpha, timestamp=1333387516772, value=b ... 手ごろなfixture作成にはよいが、これで1億件やる気はしない b) importtsv の使い方既存のインポートツールを利用する方法。入力データはtsv,csvに限定されるが、hbase.jarに含まれるImportTsvが目的に合致する。実行にはhbase.jarファイルのフルパスが必要なので、まずはjarをlocateなどで探す。 % lo

somemo 2014/08/25

hbase
hadoop

リンク

Acroquest Technology、Hadoop/HBaseの内部動作を可視化する「halook」をオープンソースとして公開、WGP1.0βおよびENdoSnipe5.0βを同時リリース | gihyo.jp

Acroquest Techno logy、Hadoop/HBaseの内部動作を可視化する「halook」をオープンソースとして公開、WGP1.0βおよびENdoSnipe5.0βを同時リリース Acroquest Techno logy株式会社は2012年11月9日、Hadoop/HBaseの内部動作を可視化するソフトウェア「halook」をオープンソースとして公開し、併せてWGP1.0βおよびENdoSnipe5.0βをリリースした。 DataNode間の偏りやMapReduce Taskの動作状況を可視化 Hadoop分散ファイルシステムであるHDFSは、クラスタを構成するDataNodeに、データを分散して保存する。今回リリースされたhalookは、このDataNode間におけるデータの偏り方を可視化するもの。 halookでDataNode間の様子を可視化また、MapReduceに

somemo 2014/08/09

hadoop
hbase

リンク

Facebookのリアルタイム Big Data 処理

"PyCon JP 2011"のライトニングトークでの資料です。 Cassandraベースでどのようにトランザクションを実現したか（の概略）と、 webフレームワークであるweb2py用のCMSプラグインのご紹介です。最近はCassandraをマイクロサービス/サービスメッシュ基盤へ応用しています。 https://b-rabbit.jp/

somemo 2014/07/30

hadoop
hbase

リンク

Tokyo HBase Meetup - Realtime Big Data at Facebook with Hadoop and HBase (ja)

This is the Japanese translation of the presentation at Tokyo HBase Meetup (July 1, 2011) Author: Jonathan Gray Software Engineer / HBase Commiter at Facebook

somemo 2014/07/30

hbase
hadoop

リンク

Takuya Ueshin presentations

2019.03.19 Deep Dive into Spark SQL with Advanced Performance Tuning

somemo 2014/07/29

hbase
hadoop

リンク

Osc2012 spring HBase Report

OSC 2012 Tokyo Spring HBaseのIOのアーキテクチャと、性能検証、Zabbixでの性能監視の発表資料です。 OSCのサイトにも掲載されています。

somemo 2014/07/29

リンク

HBaseのRow Keyの設計についてのメモ - wyukawa's diary

Facebook Messageで使われたり、LINEのストレージで使われたり、と事例も多く出てきているHBase（Bは大文字。これ重要）ですが、個人的に少し興味も湧いてきたのでちょっと調べてます。HBaseはLog-Structured Merge-tree (LSM-tree)というアーキテクチャを使っており大量データの書き込みに最適化されています。なので大量の書き込みがあり読み込みは直近のもののみというメッセージ系アプリに向いているんだと思います。そういえば半額に釣られてManning | HBase in Actionも買ってしまいました。この本の4章のRow Keyの設計についての話があってそれがちょっと面白かったので関連してRow Keyについて少し書いてみます。まずHBaseはカラム指向のデータベースと呼ばれますがデータモデルは多次元ソートマップです。図解すると下記の

somemo 2014/07/29

hbase
hadoop

リンク

このページを見るには、ログインまたは登録してください

Facebookで投稿や写真などをチェックできます。

somemo 2014/07/29

リンク

Blog - LINE ENGINEERING

As of October 1, 2023, LINE has been rebranded as LY Corporation. Visit the new blog of LY Corporation here: LY Corporation Tech Blog

somemo 2014/07/29

hbase
redis

リンク

PHP＋Thrift＋HBaseを試してみた - Do You PHP はてブロ

使ってる人にとっては何周目かの今さら感漂いますが、ひょんなことから調べる必要が出てきたのでざっくりまとめてみました。環境 CentOS6.3 PHP5.5.3 JDK1.6.0-45 HBase0.94.11 Thrift0.9.1 HBaseとは HBaseはKVS(Key-Value Store)の1つで、ASF(Apache Software Foundation)のHadoopプロジェクトの一環として作られたオープンソースソフトウェアです。本家はApache HBase – Apache HBase™ Homeです。 HBaseのアーキテクチャを理解しよう (1/3)：CodeZine（コードジン）とりあえず、以下の記事をざっと読むと良いかと。いまさら聞けないKVSの常識をHbaseで身につける (1/3)：ビッグデータ処理の常識をJavaで身につける（3） - ＠IT HB

somemo 2014/07/29

リンク

Hadoopカンファレンス20140707

ーーーーーーーーーーーーーーーーーーーーーーー schoo WEB-campusは「WEBに誕生した、学校の新しいカタチ」。ＷＥＢ生放送の授業を無料で配信しています。 ▼こちらから授業に参加すると、先生への質問や、ユーザーとのチャット、資料の拡大表示等が可能です。 https://schoo.jp/class/000/room ーーーーーーーーーーーーーーーーーーーーーーー

somemo 2014/07/23

hadoop
hbase

リンク

HBase 0.96 で導入される新しいコンパクション「Exploring Compaction」 - 科学と非科学の迷宮

Hadoopアドベントカレンダー2013、3日目を担当する @shiumachi です。今回は HBase 0.96 の新機能を一つ紹介します。要約 HBase 0.96 は賢くなったのでみんな使おう。コンパクションのおさらい HBase では、Log Structured-Merge tree (LSM-tree) というデータ構造を使っています。 LSM-tree を簡単に説明すると、入力されたデータをログとメモリ上のデータストア(Memstore、メモリストア) に書き込みます。メモリストアがいっぱいになると、まとめてディスクにフラッシュし、新しいストアファイルを生成します。このストアファイルがたまってきたときに、少しづつ一まとめにしてなるべくファイル数を少なくするようにします。これがコンパクションです。コンパクションを実行することにより、ファイルは一つにまとまります。こ