タグ

2021年5月11日のブックマーク (1件)

  • データ分析基盤構築の肝は、データレイクとDWHの分離 - NRIネットコムBlog

    こんにちは佐々木です。 いろいろなところで口を酸っぱくして言っているのは、データレイクとDWHを分離しろと。とりあえずDWHに放り込むという考えはあるけど、DWHに入れる時点でデータの整形が行われて、情報の欠損がでてくる。だから、その前にデータレイクに生のままに入れること— Takuro SASAKI (@dkfj) 2021年5月1日 データレイクとDWHの分離について呟いたら、それなりの反響を頂きました。せっかくの機会なので、もう少ししっかりと解説してみます。何故、データレイクとDWHを分離する必要があるのか、格納するデータの構造と、データレイク・DWHの役割の観点から考えてみましょう。まずは、データの種類として、構造化データや非構造化データの説明をします。その次に、データレイクとDWHなどの用語・役割の説明をし、最後にアーキテクチャを考えてみます。 構造化データと半構造化データ、非構

    データ分析基盤構築の肝は、データレイクとDWHの分離 - NRIネットコムBlog
    manji6
    manji6 2021/05/11
    あんまりマーケティングのことを考えておらず、分析屋の話に見えますね。中間処理部分のコストを上げてしまうと、結局分析して見つけたインサイトをどうやって活用するんだろう。