タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

DataLakeとAWSに関するnminoruのブックマーク (2)

  • AWS Glue と Amazon S3 を使用してデータレイクの基礎を構築する | Amazon Web Services

    Amazon Web Services ブログ AWS Glue と Amazon S3 を使用してデータレイクの基礎を構築する データレイクは、大量の様々なデータを扱うという課題に対処するため、データを分析および保存するための方法としてますます一般的になっています。データレイクを使うと、組織は全ての構造化データおよび非構造化データを1つの中央リポジトリに格納できます。データはそのまま保存できるため、あらかじめ定義されたスキーマに変換する必要はありません。 多くの組織は AWS をデータレイクとして使う価値を理解しています。例えば Amazon S3 は高い耐久性があり、コンピューティングとストレージの分離をしながら、オープンデータフォーマットをサポートする費用対効果の高いオブジェクトの開始ができ、全てのAWS 分析サービスと連携します。Amazon S3 はデータレイクの基礎を提供します

    AWS Glue と Amazon S3 を使用してデータレイクの基礎を構築する | Amazon Web Services
  • AWS上でのデータレイク構築の概要を紹介している『Building a Data Lake on AWS』を読んでみた | DevelopersIO

    先日、『データレイク』で情報を調べてみたら『Building a Data Lake on AWS』というeBookの資料(PDF)がある事を知りました。比較的ボリューム短めで読み易かったので、当エントリではその読んでみた内容をご紹介してみたいと思います。 Data Lake on AWS 『データレイク』とは何か 今日、組織では様々なソースからなる複数種別のデータを管理する業務が行われています。大規模なデータボリューム、様々なデータの種類に直面し、組織はタイムリーに洞察力を組織内に提供する為に、従来のデータ管理システム以上の敏捷性と柔軟性を備えるデータストレージと分析ソリューションを必要としています。 "データレイク"は、最近注目されるようになってきた新しい方法です。これら課題の多くに対応するデータを格納し、分析する事が出来ます。データレイクを構築する事で、組織は構造化されたもの、非構造

    AWS上でのデータレイク構築の概要を紹介している『Building a Data Lake on AWS』を読んでみた | DevelopersIO
    nminoru
    nminoru 2016/10/30
    Amazon S3ということはdata-driven parallel processingではないのか。
  • 1