Hadoop Conference Japan 2016 で発表した資料です。 http://www.eventbrite.com/e/hadoop-spark-conference-japan-2016-tickets-20809016328 この資料は前半部分です。ドワンゴ志村様による後半部分はこちら: http://www.slideshare.net/smrmkt/hadoopetl-niconico ---- (アブストラクト) ETL(Extract, Transform, Load) は、外部のソースからデータを抽出し、業務上必要な形に加工し、データ基盤にロードするための一連の技術です。Hadoopの登場により、スケーラブルかつ柔軟なスキーマ構造を持つデータレイヤーであるHDFSに代表される、ETLにおける多くの物理アーキテクチャに変化がもたらされました。しかし一方で、ETL
![データドリブン企業における、hadoop基盤とETL #hcj2016](https://cdn-ak-scissors.b.st-hatena.com/image/square/c407537e52bdfa0f2f5a664e1f7d0386f309b5e9/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Fhcj2016hadoopetl2016-02-08-160208044506-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)