Datapaloozaで発表した資料です。 http://www-01.ibm.com/software/jp/events/analytics2/ 現在、DMM.com ラボでは、1日あたり1億レコード以上の行動ログを中心に、各サービスのコンテンツ情報や、地域情報のようなオープンデータを収集し、データドリブンマーケティングやマーケティングオートメーションに活用しています。本発表では、DMM.comのビッグデータ基盤について紹介し、ビッグデータを処理するためのSQLの活用について発表します。特に、代表的なSQL on HadoopのプロダクトであるHiveやSparkSQL, Prestoの活用事例や、Sqoopを用いたRDBとの連携について、具体的な事例や導入時の注意点を解説し、現状の課題と今後の方針についても紹介します。 Ractor is a new experimental fea
![投げやすい椅子と投げにくい椅子の見分けかた #monitoringcasual](https://cdn-ak-scissors.b.st-hatena.com/image/square/d7dfe341e0a28c86d71bcc1c235b203a068e2399/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Fmonitoringcasual01-120617221412-phpapp01-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)