[B! kafka] [2ページ] msyktのブックマーク

GitHub - Landoop/kafka-connectors-tests: Test suite for Kafka Connect connectors based on Landoop's Coyote and docker.

msykt 2018/11/11

kafka

リンク

Data Infrastructure at In Loco

Every single tech company that operates at a very large scale will tell you about the importance of knowing how to properly handle data transport and manipulation. When providing context-aware location services for 50 million users on mobile phones all over the world, we at In Loco need to constantly re-imagine and re-invent our infrastructure such that not only our developers and overall data ana

msykt 2018/05/03

“From a technical standpoint, the presented data architecture has allowed us to scale to the throughput of over 200MBps (or over 15TB per day) produced on a daily basis on our Kafka clusters. ”

リンク

Kafka/Fluentd/Sparkを用いたデータ分析基盤の運用話 by ペンギン愛好家さん - niconare

新宿Geek Lounge#4 分析基盤Meetup ver2での発表資料です。 https://shinjuku-geek-lounge.connpass.com/event/83127/

msykt 2018/04/03

Kerberos認証かけてて良いな。「起こるはずがない」ブロックに入って困ったことある。結構困る。

リンク

Apache Kafkaを使ったアプリ設計で反省している件を正直ベースで話す

Apache Kafka: Producer, Broker and Consumer2017年は生まれて始めてApache Kafkaを本格的に業務利用（PoCではなく本番運用）した年でした。Apache Kafka的なメッセージングミドルウェアそのもののは、社内的な事情でよく使っていたのでその使い勝手に対して困惑はほとんど無かったですし、ミドルウェアとして非常に安定しているため、Kafkaクラスタそのものでの不具合らしい不具合が発生したことは一度もありませんでした。しかし、Kafkaのトピック設計などに関してのベストプラクティスは事例ベースでもあまり見かけたことがなく、チームメンバーと悩むことも多かったです。このストーリーでは、主にKafkaを利用したアプリ設計で考えたことや失敗したことを振り返りつつ共有します。なお、パーティション数や各種バッファサイズなどのチューニング要素は今回取

msykt 2018/01/06

kafka

リンク

Streaming databases in realtime with MySQL, Debezium, and Kafka

Change data capture has been around for a while, but some recent developments in techno logy have given it new life. Notably, using Kafka as a backbone to stream your database data in realtime has become increasingly common. If you’re wondering why you might want to stream database changes into Kafka, I highly suggest reading The Hardest Part About Microservices: Your Data. At WePay, we wanted to i

msykt 2017/12/31

Debeziumを使ってMySQLの更新内容をBigQueryに反映させる、という話

リンク

Home · GeoMesa

msykt 2017/06/28

リンク

Powering Big Data at Pinterest. Interview with Krishna Gade. | ODBMS Industry Watch

msykt 2015/04/26

S3にログを書き込むSecorというツールが気になったのと、SparkとMemSQLの連携が面白そう

リンク

電子書籍「Apache Kafka入門」をリリースしました - Advanced Technology Lab

こんにちは。シニアリサーチエンジニアの中野ですアドバンスドテクノロジーラボで調査検証を進めてきたApache Kafkaについて、その結果をAmazonの電子書籍としてまとめました。 (だいぶ前に公開だけしていたのですが、ブログに書くことを忘れていました！) Apache Kafka入門伊橋正義 (著), 原田勝憲 (著), 中野猛 (編) Hadoopなどの大規模分散処理には欠かせない、ノード間の協調動作を支えるミドルウェアであるKafkaですが、裏方の仕組みであるためあまりそれだけに注目されることはなく、そのためか日本語の情報ソースも限られていました。そして、ラボではStormを、DB操作と同じ程度の気軽さで利用できる仕組みを開発しており、その中でKafkaを幅広く活用しています。このため、Kafkaの情報を日本語で公開することは他所においても価値があると考え、このたび

msykt 2014/05/16

買った!

kafka

リンク

re:InventでのLogglyの分散ストリーム処理環境に関するセッションが面白かったのでまとめておく - すずけんメモ

さきほど帰国。parse.comのメモに引き続き、re:InventでのLogglyのセッションについてもまとめておく。【追記 2013/11/20 9:20】スライドがupされていたので貼っておきます。要約すると、お客さんから大量に送られてくるログをリアルタイムに捌くためのシステム最初の設計ではSolrCloudを利用していた第二世代ではElasticsearchを利用。システム全体としてElasticな環境に。基本環境はKafka + Stormな構成セッションの情報は以下のとおり。 ARC303 - Unmeltable Infrastructure at Scale: Using Apache Kafka, Twitter Storm, and Elastic Search on AWS This is a technical architect's case stu

msykt 2013/11/28

Loggyというサービスを初めて知った。Kafka/Storm/Elastic Searchかぁ

kafka
storm

リンク

Apache Kafka 概要（Design）和訳まとめ - 夢とガラクタの集積場

こんにちは。ようやく１ページ全てまとめ終わったので、最後にまとめ投稿として投稿しておきます。尚、ページは下記です。 http://kafka.apache.org/07/design.html ＝＝＝＝＝＝＝＝＝＝ 1.何故Kafkaは作られたのか？元々はLinkedInのActivity StreamとData Processingをパイプライン式に繋ぐために開発されたプロダクト。最近はTumblr、DataSiftといった企業でも使用されている。 →　SNSや、複数のサービスの情報を統合するようなシステムで使われているようです。ここでいうActivity Streamとは Webページで閲覧、検索、リンク設定などを行う活動全般を指す。これらのデータは通常のシステムならば、ログファイルとして出力し、後で別途解析に用いられる。もう一つ言葉を定義する。 Operational

msykt 2013/07/14

kafka

リンク

Kafka: The Great Logfile in the Sky

Discussion of Apache Kafka's design and details around how and why one might use it within a Ruby application. Given at Lone Star Ruby Conference on 8/1…

msykt 2012/08/28

kafka
log

リンク

Apache Kafka

Why we built this Kafka is a messaging system that was originally developed at LinkedIn to serve as the foundation for LinkedIn's activity stream processing pipeline. Activity stream data is a normal part of any website for reporting on usage of the site. Activity data is things like page views, information about what content was shown, searches, etc. This kind of thing is usually handled by loggi

msykt 2012/06/26

kafka

リンク

What are the differences between Apache Kafka and RabbitMQ?

Answer (1 of 12): AMQP is more mature than Kafka, and also RabbitMQ is more mature than Kafka, Also according to their paper from last year, Kafka was designed as a logging system, and that is too specialised. RabbitMQ just deals with messages of any type. It can handle short messages (under 16 b...