タグ

2017年4月6日のブックマーク (3件)

  • “ビッグデータの湖”データレイクとは何だ? EMCが答える (1/2)

    ビッグデータ活用を進めるために、ストレージ基盤は“データの大きな湖”になるべきだ――。EMCジャパンは11月28日、記者説明会を開催し、ストレージ領域の新コンセプトである「データレイク」とは何か、どう実現していくかについて説明を行った。 ビッグデータから得られる価値を先に考えるのは「無理がある」 説明を行ったEMCジャパンの大川博史氏はまず、ビッグデータ活用に対する企業の意識調査の結果から話を切り出した。同社が今年9月に行ったオンラインアンケートでは、およそ8割の企業がビッグデータ活用に関心がある、もしくは活用中だと答えた。ただし、過半の企業は、関心を持ちつつも「具体的には検討は未着手」(全体の45%)だという。 ビッグデータ活用や検討を進めるうえで、何がネックになっているのか。回答を見ると「費用対効果が不明」「何から着手してどう進めればよいかわからない」が上位に並ぶ。「そもそもビッグデー

    “ビッグデータの湖”データレイクとは何だ? EMCが答える (1/2)
  • AWS上でのデータレイク構築の概要を紹介している『Building a Data Lake on AWS』を読んでみた | DevelopersIO

    先日、『データレイク』で情報を調べてみたら『Building a Data Lake on AWS』というeBookの資料(PDF)がある事を知りました。比較的ボリューム短めで読み易かったので、当エントリではその読んでみた内容をご紹介してみたいと思います。 Data Lake on AWS 『データレイク』とは何か 今日、組織では様々なソースからなる複数種別のデータを管理する業務が行われています。大規模なデータボリューム、様々なデータの種類に直面し、組織はタイムリーに洞察力を組織内に提供する為に、従来のデータ管理システム以上の敏捷性と柔軟性を備えるデータストレージと分析ソリューションを必要としています。 "データレイク"は、最近注目されるようになってきた新しい方法です。これら課題の多くに対応するデータを格納し、分析する事が出来ます。データレイクを構築する事で、組織は構造化されたもの、非構造

    AWS上でのデータレイク構築の概要を紹介している『Building a Data Lake on AWS』を読んでみた | DevelopersIO
  • データレイクとは何かをわかりやすく解説、DWHとの違い、メリット、製品比較7選など

    データレイクvsデータウェアハウス データレイクに似たキーワードとして、データウェアハウスがある。どちらも大量のデータを格納し、分析するためのシステムだが、その目的と使用方法には大きな違いがある。 データウェアハウスは、目的が明確な主に構造化されたデータを格納している。使用されないデータを保持する可能性が低い。また、データは表形式などで使用されほとんどの社員が扱うことができ、事前に定義されたクエリを実行して分析することが容易になる。 一方、データレイクは、目的が明確ではない多様なデータを格納しているため、多大なストレージ容量を必要とする場合がある。処理されていないデータも扱うこととなるため、専門的な知識を有するデータサイエンティストなどの専門職が主に利用することになる。構造化データだけでなく非構造化データも格納しているため、分析の自由度は高い。 「どちらを使用すべきか?」という疑問が浮かぶ

    データレイクとは何かをわかりやすく解説、DWHとの違い、メリット、製品比較7選など