新宿Geek Lounge#4 分析基盤Meetup ver2での発表資料です。 https://shinjuku-geek-lounge.connpass.com/event/83127/
![Kafka/Fluentd/Sparkを用いたデータ分析基盤の運用話 by ペンギン愛好家 さん - niconare](https://cdn-ak-scissors.b.st-hatena.com/image/square/1bc33ddd8884e745431f4c47f6d4785f307ae32e/height=288;version=1;width=512/https%3A%2F%2Fcdn.fccc.info%2Fthumbnails%2F640x480%2F22ba79ff49e3ed849f241e89b0035c13%2FIhu1%2Fknowledge%2F59c1280697a48e1e198923846b902e0a%2F1.jpg)
うちの環境ではKafka -> kafka-fluentd-consumer -> Fluentd -> Elatsticsearchという経路でログをElatsticsearchに送ってKibanaで可視化しています。 ところがKibanaで直近のログが見れないという問い合わせがあり調査していたら、kafka-fluentd-consumerのConsumerLagが大きい状態で、要はconsumerで詰まっていた。 jmx, prometheus経由でConsumerLagはモニタリングしていたのですが、あんまりちゃんと見てなくて気付けば定期的にlagが大きくなっている状態でした。 まあほっといても解消してた気もしますが、調査しました。 hasNextのConsumerTimeoutExceptionの部分の詳細を見たほうがいいのではという話になりログを仕込んで再起動しました。他にもロ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く