[B! DataLake][AWS] nminoruのブックマーク

nminoru id:nminoru

DataLakeとAWSに関するnminoruのブックマーク (2)

AWS Glue と Amazon S3 を使用してデータレイクの基礎を構築する | Amazon Web Services
Amazon Web Services ブログ AWS Glue と Amazon S3 を使用してデータレイクの基礎を構築するデータレイクは、大量の様々なデータを扱うという課題に対処するため、データを分析および保存するための方法としてますます一般的になっています。データレイクを使うと、組織は全ての構造化データおよび非構造化データを１つの中央リポジトリに格納できます。データはそのまま保存できるため、あらかじめ定義されたスキーマに変換する必要はありません。多くの組織は AWS をデータレイクとして使う価値を理解しています。例えば Amazon S3 は高い耐久性があり、コンピューティングとストレージの分離をしながら、オープンデータフォーマットをサポートする費用対効果の高いオブジェクトの開始ができ、全てのAWS 分析サービスと連携します。Amazon S3 はデータレイクの基礎を提供します
nminoru 2017/11/02
AWS

DataLake

Diarying
リンク
AWS上でのデータレイク構築の概要を紹介している『Building a Data Lake on AWS』を読んでみた｜ DevelopersIO
先日、『データレイク』で情報を調べてみたら『Building a Data Lake on AWS』というeBookの資料(PDF)がある事を知りました。比較的ボリューム短めで読み易かったので、当エントリではその読んでみた内容をご紹介してみたいと思います。 Data Lake on AWS 『データレイク』とは何か今日、組織では様々なソースからなる複数種別のデータを管理する業務が行われています。大規模なデータボリューム、様々なデータの種類に直面し、組織はタイムリーに洞察力を組織内に提供する為に、従来のデータ管理システム以上の敏捷性と柔軟性を備えるデータストレージと分析ソリューションを必要としています。 "データレイク"は、最近注目されるようになってきた新しい方法です。これら課題の多くに対応するデータを格納し、分析する事が出来ます。データレイクを構築する事で、組織は構造化されたもの、非構造
nminoru 2016/10/30
Amazon S3ということはdata-driven parallel processingではないのか。

AWS

DataLake
リンク
1