タグ

hbaseとapacheに関するclavierのブックマーク (2)

  • Apache Apexとは何なのか? - Qiita

    こんにちは。 最近広まってきているストリーム処理プロダクトのうちの一つとして、 Apache Apexがどんなものか、をプレゼン資料からポイントを拾ったので、まとめてみます。 ただ、その前になぜこんなことをやってみたか、という経緯を・・・ 最近のストリーム処理プロダクト概況 元々昔からストリーム処理プロダクトが好きで見ていたため、常時ゆるゆる情報は追っています。 ただ、ここ最近の状況を一言でいうと、 正直な話、いっぱい出すぎてよーわからん。 に尽きると思います。 とりあえず私の(狭い)観測範囲の中だけ見てみても、これだけプロダクトが出てきてしまっています。 公開時期はアバウトなものですので、こんな感じでたくさん出ているというイメージだけ持っていただけると。 あとKafka Streamsはアイコンないのでconfluentのアイコンです。わかる方がいればこちらも。 で、上記の中で個人的に気

    Apache Apexとは何なのか? - Qiita
  • 管理が困難―分散処理の常識はZooKeeperで変わる

    管理が困難―分散処理の常識はZooKeeperで変わる:ビッグデータ処理の常識をJavaで身につける(8)(1/3 ページ) Hadoopをはじめ、Java言語を使って構築されることが多い「ビッグデータ」処理のためのフレームワーク/ライブラリを紹介しながら、大量データを活用するための技術の常識を身に付けていく連載 分散処理の課題が「管理」なのは常識 複数の計算機上で動作(分散)するアプリケーション、ソフトウェアが多く存在します。分散ソフトウェアは複数の計算機で動作することで大量のデータを扱えたり、高負荷な状況に対処します。稿では、複数の計算機(クラスタ)で動作する各サーバを「インスタンス」と呼びます。 連載で紹介した分散Key-Valueデータベースである「HBase」は複数の計算機で動作する代表的なソフトウェアです。両ソフトウェアはともに「Apache ZooKeeper」(以下、Z

    管理が困難―分散処理の常識はZooKeeperで変わる
  • 1