元記事: http://blog.cloudera.com/blog/2017/05/data-engineering-with-cloudera-altus/ 元記事著者: Philip Langdale 現代のビジネスでは、より膨大な量のデータや一連のデータソースを扱うため、分析、可視化、レポート作成を可能にするデータエンジニアリングの重要性がますます高まっています。 パブリッククラウドでのデータエンジニアリングワークロードでは、オンプレミスの導入とは異なる運用モデルが可能となります。ここでの主な要素は、クラウド環境内に別個のストレージレイヤが存在することと、オンデマンドでコンピューティングリソースをプロビジョニングする能力 (例: それぞれ Amazon S3 と EC2) です。このような環境では、データサイロを作り出すことなくデータストレージを計算リソースから切り離すことが可能に