[B! Kafka] [5ページ] wlbhiroのブックマーク

Spark and Kafka integration patterns – part 2

wlbhiro 2016/09/25

Spark
Kafka

リンク

Kafka+Spark Streaming+Elasticserachによるシステム構築と検証の進め方

はじめに前回はSpark Streamingの概要と検証シナリオ、および構築するシステムの概要を解説しました。今回はシステムの詳細構成と検証の進め方、および初期設定における性能測定結果について解説します。この検証ではメッセージキューのKafka、ストリームデータ処理のSpark Streaming、検索エンジンのElasticsearchを組み合わせたリアルタイムのセンサデータ処理システムを構築しています。今回はKafkaとElasticsearchの詳細なアーキテクチャやKafkaとSparkの接続時の注意点も解説します。システムの詳細構成マシン構成とマシンスペック評価に向けたマシンの初期構成を図1に示します。本システムは以下のノードから構成されます。センサデータを収集してKafkaに送信する収集・配信ノード Kafkaクラスタを構成してメッセージの受け渡しを行うキューとして

wlbhiro 2016/07/27

リンク

fluent-plugin-kafka: fluentd と Kafka の連携 — kafka-docs 0.0.1 ドキュメント

fluent-plugin-kafka: fluentd と Kafka の連携¶ （最終更新：2016 年 1 月 1 日） fluentd 自体の詳しい説明は他に譲るとして、本文書では fluentd と Kafka を組み合わせる方法を紹介する。本文書を読むと、fluentd で syslog を読み取り、Kafka に流す設定がわかる。Kafka の起動手順は Apache Kafka Quick Start を参照のこと。本文書で作成するシステムは下図のようになる。 fluentd で syslog を読み取る¶ fluentd と Kafka を組み合わせる練習として fluentd で syslog を読み取ってみよう。syslog は適度にいろいろなログが出力されるので見ていて楽しい。はじめはデバッグのために、読み取ったログデータを標準出力に垂れ流すことにする。まずは

wlbhiro 2016/06/06

リンク

cloudera/spark-kafka-writer · GitHub

README.md Spark To Kafka Writer APIs that help in writing data from Spark and Spark Streaming to Kafka. To use this in a Spark application, use Cloudera mvn repos: https://repository.cloudera.com/artifactory/cloudera-repos and https://repository.cloudera.com/artifactory/libs-snapshot-local for SNAPSHOTs. Latest release artifact info, on maven: repository: https://repository.cloudera.com/artifactor

wlbhiro 2016/01/06

リンク

Processing Twitter Events in Real-Time with Oracle Event Processing (OEP) 12c

1. 2013 © Trivadis BASEL BERN BRUGG LAUSANNE ZUERICH DUESSELDORF FRANKFURT A.M. FREIBURG I.BR. HAMBURG MUNICH STUTTGART VIENNA 2013 © Trivadis Echtzeitverarbeitung von Twitter Streams mit Oracle Event Processing (OEP) 12c Guido Schmutz DOAG Konferenz 2014 19.11.2014 – 15:00 Raum Kiev 19.11.2014 Processing Twitter Stream with Oracle Event Processing (OEP) 1 2. 2013 © Trivadis Guido Schmutz •  Worki

wlbhiro 2015/09/11

面白い。

リンク

How to retrieve a specific count of messages from Kafka Topic

wlbhiro 2015/03/11

バッチサイズはKafkaクライアント側の設定で切り替えられる(?)

Kafka

リンク

Apache Storm and Kafka Cluster with Docker – Software Theory and Practice

This post is all about real time analytic on large data sets. I am sure every one has heard about Apache Kafka (Distributed publish subscribe messaging broker) and Apache Storm (Distributed real time computation system.) and if you were disappointed not finding the appropriate (more than Hello World.) documentation and working example on the web on how to start using both the amazing products toge

wlbhiro 2015/03/10

Topicのパーティション設定

Kafka

リンク

GitHub - claudemamo/kafka-web-console: A web console for Apache Kafka (retired)

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

wlbhiro 2015/03/10

Kafka用Web UI

Kafka
UI

リンク

Kafkaをとりあえず動かす - 元データ分析の会社で働いていた人の四方山話

最近TL等ではKafkaという単語をよく目にするようになってきましたが、kafkaとググっても日本語の情報がほとんどないのが悲しいですね。というわけで本家ドキュメントのQuick Start的なモノを動かしてみた話です。本当に動かすだけです。が、以外にこのレベルの情報もない！のがKafkaですね。もっとあっても良さそうなのに。。。 Kafkaってなんなのよ、って話は今は触れずにとりあえずKafkaをローカル環境にて動かしてみます。 Apache Kafka 公式ドキュメントのQuick Startに従います。とりあえず動かす Kafkaを取ってくるミラーサイトからKafkaを取ってきます。最新版は8.2.0のようですが、公式ドキュメントは8.1.1なので、8.1.1を取ってきます。適当に展開しましょう。 $ wget http://ftp.tsukuba.wide.ad.jp/so

wlbhiro 2015/02/27

Kafkaの使い方

Kafka

リンク

KeeperErrorCode = NoNode for /brokers/topics/test-topic/partitions

wlbhiro 2015/02/27

KafkaとZooKeeperのバージョンの不一致によるエラーの場合もある。

リンク

Maven Repository: org.apache.kafka » kafka_2.10 » 0.8.2.0

wlbhiro 2015/02/27

リンク

Running a Multi-Broker Apache Kafka 0.8 Cluster on a Single Node

In this article I describe how to install, configure and run a multi-broker Apache Kafka 0.8 (trunk) cluster on a single machine. The final setup consists of one local ZooKeeper instance and three local Kafka brokers. We will test-drive the setup by sending messages to the cluster via a console producer and receive those messages via a console receiver. I will also describe how to build Kafka for

wlbhiro 2015/02/26

Cluster設定

Kafka

リンク

GitHub - thilinamb/flume-ng-kafka-sink: An Apache Flume Sink implementation to publish data to Apache Kafka

wlbhiro 2015/02/26

リンク

storm-kafka-starter/src/jvm/storm/starter/KafkaTopology.java at master · thehydroimpulse/storm-kafka-starter

wlbhiro 2015/02/23

Stormのexternalに付属されているStorm-Kafkaのサンプルプログラム。　0.9.3では、メソッド名が変わっていて使えない。(StaticHosts.fromHostString)

Storm
Kafka

リンク

Tour of Distributed Systems 3 - Apache Kafka

OpenBSD/luna88k on LUNA-88K2, presented at OSC (Open Source Conference) 2013 Nagoya, as a part of NBUG(Nagoya *BSD Users' Group) meeting in 2013-06.

wlbhiro 2015/02/02

Kafka

リンク

Apache Kafka

From Message to Cluster: A Realworld Introduction to Kafka Capacity Planningconfluent

wlbhiro 2015/02/02

Kafka

リンク

Clients - Apache Kafka - Apache Software Foundation

How The Kafka Project Handles ClientsStarting with the 0.8 release we are maintaining all but the jvm client external to the main code base. The reason for this is that it allows a small group of implementers who know the language of that client to quickly iterate on their code base on their own release cycle. Having these maintained centrally was becoming a bottleneck as the main committers can't

wlbhiro 2015/02/02

サードパーティの便利クライアント

Kafka

リンク

Samza

Samza allows you to build stateful applications that process data in real-time from multiple sources including Apache Kafka. Battle-tested at scale, it supports flexible deployment options to run on YARN or as a standalone library.

wlbhiro 2015/01/20

リンク

Introduction to Kafka and Zookeeper

wlbhiro 2014/12/01

Kafka

リンク

Kafkaによるリアルタイム処理

This document discusses Kafka, a distributed messaging system originally created by LinkedIn and now an Apache project. It provides an overview of how Kafka works and how various companies use it, including for log processing (LinkedIn), analytics (Facebook, Twitter, Google), and integrating with other techno logies like Hadoop, Zookeeper, HBase and Storm. It also covers Kafka's scalability, perfor