翔泳社主催 Developers Summit 2018 15-B2の講演資料です。 ----------------- HadoopやSparkは、スタンダードな分析基盤として今ではすっかり定着しました。その上で、エンジニアにはPythonやRを使った機械学習などを求められるケースも多いかと思います。 また、従来のビッグデータではオフライン分析が主でしたが、Kafkaの台頭により、ストリームデータに対する要件も増えてきました。 本セッションでは、ストリームとバッチを融合したアナリティクスの事例紹介をベースにKafkaやHadoopでデータをストアし、Zeppelin上での機械学習をチュートリアル形式でお伝えします。 さらに、これからデータサイエンティストを目指す方のために、これらの環境を"タダ"で利用できるOracleのCloud環境も併せてご紹介させていだきます。 ----------
![広告におけるビッグデータの分析事例](https://cdn-ak-scissors.b.st-hatena.com/image/square/67bf9caa8a08b62af5c67173661347d31b6087b2/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Ftableausession-160324043027-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)