Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー... 翔泳社主催 Developers Summit 2018 15-B2の講演資料です。 ----------------- HadoopやSparkは、スタンダードな分析基盤として今ではすっかり定着しました。その上で、エンジニアにはPythonやRを使った機械学習などを求められるケースも多いかと思います。 また、従来のビッグデータではオフライン分析が主でしたが、Kafkaの台頭により、ストリームデータに対する要件も増えてきました。 本セッションでは、ストリームとバッチを融合したアナリティクスの事例紹介をベースにKafkaやHadoopでデータをストアし、Zeppelin上での機械学習をチュートリアル形式でお伝えします。 さらに、これ