はじめに Flumeから流れてきたデータをSpark Streamingする。 実現したいことのイメージ。 netcatサーバーでデータ生成 Flumeはクライアントからデータを受け取り、Sparkに流し込む Spark Streamingでデータを集計 環境 Scala IDE for Ecipse : 2.10.4 flume-ng-sdk-1.3.1.jar spark-assembly-1.1.0-hadoop2.4.0.jar spark-streaming-flume_2.10-1.1.0.jar spark-streaming-flume-sink_2.10-1.1.0.jar Spark Streamingを開始する ソースコードはSparkのサンプルコードをもとに作成。 spark/FlumeEventCount.scala at master · apache/spar