タグ

kafkaに関するteddy-gのブックマーク (5)

  • Apache Kafka & Google Cloud Pub/Sub 主要機能の比較

    執筆者: 秋葉原ラボ  sitotkfm&rshtykh はじめに 秋葉原ラボでは大規模データ処理基盤の研究・開発・運用を行っており、データの転送や解析システムのHubとしてPubsubシステムの重要性が高まっている。 Pubsubメッセージングモデルは、非同期メッセージングパラダイムの一種であり、メッセージの送信者(出版側)が特定の受信者(購読側)を想定せずにメッセージを送るようプログラムされたものである(wikipedia)。Pubsubモデルを用いることでシステムアーキテクチャにおいてコンポーネント同士を疎結合にし、高スケーラビリティを実現するメッセージングパターンである。このモデルに基づいたソリューションは既に複数存在するが、今回は特に注目されているApache KafkaやGoogle Cloud Pub/Subを紹介し、システム面で重要と思われる機能を比較する。 Kafkaは、

    Apache Kafka & Google Cloud Pub/Sub 主要機能の比較
    teddy-g
    teddy-g 2018/02/18
    Apache KafkaはPubsub
  • 分散ストリーム処理エンジンあれこれ - Qiita

    分散ストリーム処理エンジンの群雄割拠の時代 ストリーム処理を実現する分散プラットフォームが、大分増えました。 何が良いか/悪いかは、プラットフォームに求める内容や、関連するエコシステムにも影響するため、一概には言えないですが、Apacheで提供されているOSSとして、情報をまとめたものがあったので、ポイントをまとめたいと思います。 AN OVERVIEW OF APACHE STREAMING TECHNOLOGIES https://databaseline.wordpress.com/2016/03/12/an-overview-of-apache-streaming-technologies/ 特長 ストリーム処理といっても、位置づけが異なるものも一緒くたに書かれているので、位置づけを分類しながら、特長を整理してみます。 データ収集系 ログやイベントを収集するようなタイプ。 Flum

    分散ストリーム処理エンジンあれこれ - Qiita
    teddy-g
    teddy-g 2016/11/14
    英語版の記事の概要と筆者の個人的見解が書いてある。技術詳細は英語版見た方が良い。
  • An Overview of Apache Streaming Technologies | Databaseline

    There are many technologies for streaming data: simple event processors, stream processors, and complex event processors. Even within the open-source community there is a bewildering amount of options with sometimes few major differences that are not well documented or easy to find. That’s why I’ve decided to create an overview of Apache streaming technologies, including Flume , NiFi , Apex ,  Spa

    An Overview of Apache Streaming Technologies | Databaseline
    teddy-g
    teddy-g 2016/11/14
    ApacheのStreaming系のプロジェクト/技術比較一覧と説明。これにFluentdを併せて覚えておけばStream系は大体網羅できるんじゃないかな。
  • Apache Kafka について | ギャップロ

    Kafka と ZooKeeper ZooKeeper の詳細 ZooKeeper は、分散アプリケーションのためのオープンソースの分散コーディネーションサービスです。ZooKeeper は Java で動作し、Java と C のためのバインディングが用意されています。 クラスタ (マルチサーバー) セットアップ ZooKeeper は奇数単位でアンサンブルと呼ぶクラスタを組みます。アンサンブルの過半数が動作している必要があるので、奇数台のマシンを使うのがベストです。たとえば 4 台のマシンを使う場合、ZooKeeper が対応できるのはマシン 1 台の障害までです。2 台のマシンに障害が発生すると、残りの 2 台では過半数にならないためです。5 台のマシンを使えば、ZooKeeper はマシン 2 台までの障害に対応できます。 その中の 1 台がリーダー選挙を通して全ての書き込みを調停

    Apache Kafka について | ギャップロ
    teddy-g
    teddy-g 2016/11/13
    こっちはKafkaのBroker管理で使われているZookeeperのことにも触れてある。
  • Apache Kafkaに入門した

    Apache kafka 最近仕事でApache Kafkaの導入を進めている.Kafkaとは何か? どこで使われているのか? どのような理由で作られたのか? どのように動作するのか(特にメッセージの読み出しについて)? を簡単にまとめておく(メッセージングはまだまだ勉強中なのでおかしなところがあればツッコミをいただければ幸いです). バージョンは 0.8.2 を対象に書いている. Apache Kafkaとは? 2011年にLinkedInから公開されたオープンソースの分散メッセージングシステムである.Kafkaはウェブサービスなどから発せられる大容量のデータ(e.g., ログやイベント)を高スループット/低レイテンシに収集/配信することを目的に開発されている.公式のトップページに掲載されているセールスポイントは以下の4つ. Fast とにかく大量のメッセージを扱うことができる Scal

    teddy-g
    teddy-g 2016/11/13
    結局、ググってトップにくるこの記事がKafkaの説明で一番分かりやすかった。実装しない身なら、高速メッセージング処理用のPub/Sub型システムと覚えとくくらいでいいかしら。
  • 1