タグ

streamingに関するteddy-gのブックマーク (4)

  • 分散ストリーム処理エンジンあれこれ - Qiita

    分散ストリーム処理エンジンの群雄割拠の時代 ストリーム処理を実現する分散プラットフォームが、大分増えました。 何が良いか/悪いかは、プラットフォームに求める内容や、関連するエコシステムにも影響するため、一概には言えないですが、Apacheで提供されているOSSとして、情報をまとめたものがあったので、ポイントをまとめたいと思います。 AN OVERVIEW OF APACHE STREAMING TECHNOLOGIES https://databaseline.wordpress.com/2016/03/12/an-overview-of-apache-streaming-technologies/ 特長 ストリーム処理といっても、位置づけが異なるものも一緒くたに書かれているので、位置づけを分類しながら、特長を整理してみます。 データ収集系 ログやイベントを収集するようなタイプ。 Flum

    分散ストリーム処理エンジンあれこれ - Qiita
    teddy-g
    teddy-g 2016/11/14
    英語版の記事の概要と筆者の個人的見解が書いてある。技術詳細は英語版見た方が良い。
  • An Overview of Apache Streaming Technologies | Databaseline

    There are many technologies for streaming data: simple event processors, stream processors, and complex event processors. Even within the open-source community there is a bewildering amount of options with sometimes few major differences that are not well documented or easy to find. That’s why I’ve decided to create an overview of Apache streaming technologies, including Flume , NiFi , Apex ,  Spa

    An Overview of Apache Streaming Technologies | Databaseline
    teddy-g
    teddy-g 2016/11/14
    ApacheのStreaming系のプロジェクト/技術比較一覧と説明。これにFluentdを併せて覚えておけばStream系は大体網羅できるんじゃないかな。
  • Apache Kafka について | ギャップロ

    Kafka と ZooKeeper ZooKeeper の詳細 ZooKeeper は、分散アプリケーションのためのオープンソースの分散コーディネーションサービスです。ZooKeeper は Java で動作し、Java と C のためのバインディングが用意されています。 クラスタ (マルチサーバー) セットアップ ZooKeeper は奇数単位でアンサンブルと呼ぶクラスタを組みます。アンサンブルの過半数が動作している必要があるので、奇数台のマシンを使うのがベストです。たとえば 4 台のマシンを使う場合、ZooKeeper が対応できるのはマシン 1 台の障害までです。2 台のマシンに障害が発生すると、残りの 2 台では過半数にならないためです。5 台のマシンを使えば、ZooKeeper はマシン 2 台までの障害に対応できます。 その中の 1 台がリーダー選挙を通して全ての書き込みを調停

    Apache Kafka について | ギャップロ
    teddy-g
    teddy-g 2016/11/13
    こっちはKafkaのBroker管理で使われているZookeeperのことにも触れてある。
  • Apache Kafkaに入門した

    Apache kafka 最近仕事でApache Kafkaの導入を進めている.Kafkaとは何か? どこで使われているのか? どのような理由で作られたのか? どのように動作するのか(特にメッセージの読み出しについて)? を簡単にまとめておく(メッセージングはまだまだ勉強中なのでおかしなところがあればツッコミをいただければ幸いです). バージョンは 0.8.2 を対象に書いている. Apache Kafkaとは? 2011年にLinkedInから公開されたオープンソースの分散メッセージングシステムである.Kafkaはウェブサービスなどから発せられる大容量のデータ(e.g., ログやイベント)を高スループット/低レイテンシに収集/配信することを目的に開発されている.公式のトップページに掲載されているセールスポイントは以下の4つ. Fast とにかく大量のメッセージを扱うことができる Scal

    teddy-g
    teddy-g 2016/11/13
    結局、ググってトップにくるこの記事がKafkaの説明で一番分かりやすかった。実装しない身なら、高速メッセージング処理用のPub/Sub型システムと覚えとくくらいでいいかしら。
  • 1