[B! hBase] yassのブックマーク

yass id:yass

hBaseに関するyassのブックマーク (53)

MapR Community Edition組込みのMapR-DB NoSQLデータベースが無制限商業利用可能に
Spring BootによるAPIバックエンド構築実践ガイド第2版何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...
yass 2015/01/01
mapr

hadoop

hbase
リンク
パート 1 – HBase* 用 Java* ガベージ・コレクションのチューニング | iSUS
この記事は、インテル® デベロッパー・ゾーンに掲載されている「Part #1 – Tuning Java Garbage Collection for Hbase」(https://software.intel.com/en-us/blogs/2014/06/18/part-1-tuning-java-garbage-collection-for-hbase) の日本語参考訳です。このパート 1 の記事では、100% YCSB 読み取りの HBase* 用 Java* ガベージ・コレクション (GC) をチューニングする方法を説明します。パート 2 では 100% 書き込み、パート 3 では 50%/50% 読み取り/書き込みの Java* GC のチューニングを行います。すべての記事で、標準 NoSQL ワークロードである YCSB を使用します。YCSB と HBase* のインスト
yass 2014/11/07
hbase

gc

g1gc

jvm
リンク
Announcing Kylin: Extreme OLAP Engine for Big Data
We are very excited to announce that eBay has released to the open-source community our distributed analytics engine: Kylin (http://kylin.io). Designed to accelerate analytics on Hadoop and allow the use of SQL-compatible tools, Kylin provides a SQL interface and multi-dimensional analysis (OLAP) on Hadoop to support extremely large datasets. Kylin is currently used in production by various busine
yass 2014/10/25
" store pre-calculated results to serve analysis queries, generate each level’s cuboids with all possible combinations of dimensions, and calculate all metrics at different levels. "

hadoop

hbase

ebay

kvs
リンク
@nagix さんによるMapR-M7解説
草薙昭彦 @nagix 現行HBaseの色々な課題(コンパクションやリージョン分割・マージなどを意識する必要があり運用管理が難しい、障害復旧に時間がかかる、等)は、HDFSのダメさ具合とHadoopの分散システムの中にHBaseの分散システムを構築するという複雑さが主な要因になっている 2012-12-20 14:03:51 草薙昭彦 @nagix HDFSはWrite Onceのファイルシステム。分かりやすく例えるとCD-Rのようなもの。ファイルのわずかな部分を書き換えるために全てのデータを読み込んでメモリ上で一部分を更新し、全てのデータを書き込む必要がある。ファイルシステムといいつつプリミティブな機能しか備えていない 2012-12-20 14:18:15 草薙昭彦 @nagix MapRが行った改良はこのHDFSをMapR-FSに置き換えて同時アクセス・ランダムR/W可能な先進
yass 2014/05/27
Mapr

hbase

HDFS

hadoop
リンク
[B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka
3. たとえば… ⾼速性他の Hadoop YCSB Benchmark MapR 3.0.1 YCSB Benchmark 3.0.1 ディストリビューション M7 Advantage デトリビシ d (M7エディション) (ops/sec/node) (HBase) 50% read, 50% update 50% read 50% update 7965 2918 2.7x 2 7x 95% read, 5% update 3850 1541 2.5x Random Read 5934 865 6.9x Range Scan (50 rows) Range Scan (50 ) 838 274 3.1x 3 1x Hardware Configuration ©MapR Techno logies ‐ Confidential CPU : Intel® Xeon®
yass 2014/05/24
mapr

hbase
リンク
MapR M7 技術概要
2. 2 ©MapR Techno logies MapR: データセンターの完全自動化へ •  自動フェールオーバー •  自動再レプリケーション •  ハードウェアおよびソフトウェア障害からの自律回復 •  負荷分散 •  ローリングアップグレード •  ジョブやデータの損失なし •  99.999% の稼働時間高信頼処理高信頼ストレージ •  スナップショットおよびミラーによる事業継続 •  ポイントインタイムの復旧 •  エンドツーエンドチェックサム •  強い一貫性 •  ビルトイン圧縮 •  RTO ポリシーに基づく拠点間ミラー
yass 2014/04/25
mapr

hbase

btree

leveldb

index
リンク
第13章パフォーマンスチューニング
まず wiki の「Performance Tuning」を読んでください。この記事には、RAM、圧縮、JVM の設定など、パフォーマンスに関係する重要な要素についての全般的な説明があります。記事を読んだら、ここへ戻ってきてください。以下では、さらに詳しい情報へのポインタを示します。 Todd Lipcon は、「Avoiding Full GCs with MemStore-Local Allocation Buffers」と題したプレゼンテーションの中で、特に HBase の読み込み時によく発生する、すべてが止まったかのような状態になるガベージコレクション、すなわち CMS が失敗するケースと、古い世代のヒープがフラグメンテーション化するケースの 2 つを取り上げています。最初のケースに対処するには、-XX:CMSInitiatingOccupancyFraction を追加してデフォ
yass 2014/04/07
" CMS が失敗するケースに対処するには、-XX:CMSInitiatingOccupancyFractionを追加してデフォルトより低い値を設定し、CMS をデフォルトよりも早めに開始します。60 パーセントまたは 70 パーセントから開始するようにします "

java

hbase

gc

jvm

cms
リンク
Google Code Archive - Long-term storage for Google Code Project Hosting.
Code Archive Skip to content Google About Google Privacy Terms
yass 2014/01/29
" KairosDB is a fast distributed scalable time series database written primarily for Cassandra but works with HBase as well. It is a rewrite of the original OpenTSDB project started at Stumble Upon. "

time series database

opentsdb

database

cassandra

hBase
リンク
Microsoft Word - HBase_Tier_Base_Compaction.docx
HBase Tier Based Compaction by Akashnil Dutta 1. Overview The goal of the compaction selection algorithm is to schedule compactions efficiently. The current algorithm takes a set of candidate files as input, and produces a subset as output. If there is no eligible compactions, the output set can be empty. The candidate set is made of all the files in one region which are not already scheduled for
yass 2013/11/01
hbase

compaction

algorithm

toread
リンク
HBaseCon 2013 Talk
yass 2013/10/14
drill

mapr

hbase

hadoop
リンク
HiveとHBaseの連携は難しい - wyukawa's diary
Hive 0.11.0にバージョンアップしてmultiple insertに関わるバグである[HIVE-3699] Multiple insert overwrite into multiple tables query stores same results in all tables - ASF JIRAを心配しなくて良くなったけど代わりにネストしたgroup byに関わるバグである[HIVE-5237] Incorrect group-by aggregation in 0.11.0 - ASF JIRAを踏んだwyukawaです、こんにちは。ユニークユーザとか求める時にネストしたgroup byが出てくる可能性はあるのですがcount(distinct ...)とか使って回避しました。で、今回書くのはそういう話じゃなくてHiveとHBaseとの連携に関してです。結論から言うと結構
yass 2013/10/02
"今回書くのはそういう話じゃなくてHiveとHBaseとの連携に関してです。結論から言うと結構難しいです。少なくとも僕にとっては難しくて周りにHiveとHBaseのエキスパートがいるからなんとか運用がまわっているのが実態です"

hive

hbase
リンク
"Hbase at Facebook" に行ってきた - たごもりすメモ
名称表記が揺れてて微妙だけど Hbase at FaceBook on Zusaar このイベントに行ってきた。Facebookの人は "HBase Tokyo meetup" と認識していたようだ。内容のまとめはやらないので、以下の各ページなどをご覧になると良いのではないでしょうか。 Tokyo HBase Meetup - Realtime Big Data at Facebook with Hadoop and HB… Hbase at FaceBookのまとめ - Togetterまとめ FacebookがHBaseを大規模リアルタイム処理に利用している理由（前編）－ Publickey FacebookがHBaseを大規模リアルタイム処理に利用している理由（後編）－ Publickey セッションの内容と自分が考えたことと人としゃべったことをいっしょくたにここに書いておく。
yass 2013/09/29
" rotateを待つとそれだけで実時間に対する遅延になる / rotate単位を処理するMR(やHive)はそれなりに重い処理になる / そこでHDFS上でも tail して処理にかけられる PTail / PTailがMapになり、HBaseに対するクエリがReduceになる "

Facebook

hbase

PTail

puma
リンク
Xldb2011 tue 0940_facebook_realtimeanalytics
This document summarizes Facebook's real-time analytics systems. It describes Data Freeway, which uses a scala ble data streaming framework to collect log data with low latency. It also describes Puma, which performs reliable stream aggregation and storage by sharding computations in memory and checkpointing to HBase. Future work may include open sourcing components and adding scheduler support.Rea
yass 2013/09/29
Facebook

hbase

puma
リンク
Facebookの新しいリアルタイム解析システムとは？ - nokunoの日記
Facebookの新しいリアルタイム解析のシステムでは、HBaseで1日200億件のイベントを処理しているそうです。以下の記事の翻訳です。High Scalability - High Scalability - Facebook’s New Realtime Analytics System: HBase to Process 20 Billion Events Per DayFacebookがまたやってくれた。彼らは巨大なリアルタイムデータのストリームを処理するもう1つのシステムを構築したのだ。以前にもFacebookはリアルタイムなメッセージシステムをHBaseで構築している(http://highscalability.com/blog/2010/11/16/facebooks-new-real-time-messaging-system-hbase-to-store-135.ht
yass 2013/09/28
" 今度のシステムは1日200億件（＝1秒あたり20万件）のイベントを30秒以内に処理するリアルタイム解析システムだ。/ 約5ヶ月かかった。"

Facebook

hbase

puma
リンク
このページを見るには、ログインまたは登録してください
Facebookで投稿や写真などをチェックできます。
yass 2013/09/28
" Puma3では、HBaseを使う代わりに、Puma3のプロセスのメモリーの中で集約を行っているということだ。ローカルなメモリー操作はずっと高速であるので、ずっと速いスループットを達成することが出来る。"

Facebook

hbase

puma

count
リンク
NHN techcon-20120519-fujimoto
6. GREEのストレージ • MySQL (HDD + SSD) • やはりMySQL安定 / 多くのツール / 多くのノウハウと実績 • ほとんどのデータはやはりここ • 詳しくは前の前のセッション？
yass 2013/09/28
gree

facebook

puma

hbase
リンク
SpinNet : Notice of Service Termination
ご訪問いただいたお客様へのお知らせ Information for customers visiting this Web site from SpinNet アクセスいただいたWebサービスは提供を終了いたしました。長年にわたり、多くの皆様にご利用いただきましたことを心よりお礼申し上げます。 SpinNetトップページへ The Web service you are trying to access has been terminated. We would like to thank all of you for your patronage over the years. Go to the SpinNet
yass 2013/09/28
" 複数のPTailからのデータを(属性ごとになどに)集約しているのがPumaという部分。このPumaはHBaseに結果を書き込んでいる。Pumaには属性ごとにハッシュ値を用意して、同じ属性のデータはまとめている。"

facebook

puma

hbase
リンク
Tokyo HBase Meetup - Realtime Big Data at Facebook with Hadoop and HBase (ja)
This is the Japanese translation of the presentation at Tokyo HBase Meetup (July 1, 2011) Author: Jonathan Gray Software Engineer / HBase Commiter at FacebookRead less
yass 2013/09/28
Facebook

hbase

hadoop

puma

stream

count
リンク
http://opentsdb.net/misc/opentsdb-hbasecon.pdf
yass 2013/09/27
time series database

hbase

opentsdb
リンク
Apache HBase I/O - HFile - Cloudera Blog
Introduction Apache HBase is the Hadoop open-source, distributed, versioned storage manager well suited for random, realtime read/write access. Wait wait? random, realtime read/write access? How is that possible? Is not Hadoop just a sequential read/write, batch processing system? Yes, we’re talking about the same thing, and in the next few paragraphs, I’m going to explain to you how HBase achiev
yass 2013/09/23
" HFile v3 / Pack all keys together at beginning of the block and all the value together at the end of the block. In this way you can use two different algorithms to compress key and values. Compress timestamps using the XOR with the first value and use VInt instead of long. "

HBase

cloudera

hadoop

prefix encoding

diff encoding

columnar storage

compression

xor

HFile

bloom filter
リンク
1 2 3 次のページ