タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

データ分析に関するtaro-isのブックマーク (2)

  • データ基盤の3分類と進化的データモデリング - 下町柚子黄昏記 by @yuzutas0

    この記事は、下書き供養 Advent Calendar 2018 - Adventarの2日目の記事です。 めっちゃ専門的な内容になってしまいました。ごめんなさい。 某Slackでの議論内容をブログに書こうとしたのですが、下書きのまま放置していました。 Wednesday, August 15th と書いてあるので、約半年前の内容となります。 もくじ もくじ はじめに 「データ基盤の3分類」と「(一般的な)技術要素」 1.データレイク(Data Lake) 2.データウェアハウス(Data Warehouse) 3.データマート(Data Mart) 私が考えるデータ基盤の定義 私が考える「あるべき構成」 技術要素を分けるのはアンチパターン 進化的データモデリングを容易にしよう チームとアーキテクチャを選ぶ まとめ 参考 余談 追記 はじめに データ基盤と世間一般で言われるシステムには分類

    データ基盤の3分類と進化的データモデリング - 下町柚子黄昏記 by @yuzutas0
  • Retty林田さんが語る「分析基盤におけるAWS活用術」

    10月20日に開催された「X-Tech JAWS」では、各業種でのAWS活用事例が披露された。FoodTech代表の登壇としたのは、実名制グルメサービスを展開するRettyの林田千瑛さん。AWSと一部GCPを用いることで、2ヶ月という超短期間でデータ分析基盤を構築した事例を披露した。 2ヶ月でデータ分析基盤の構築? まあ、やるか 月間利用者数が3000万人を突破した実名制のグルメサービス「Retty」が扱う情報は多岐に渡る。お店やユーザー、料理に関するテキストや写真のほか、ユーザーの投稿、アクセスログなど、現時点で数PBを超える容量を抱えている。2017年5月に入社したばかりの林田さんだが、これらのデータの分析基盤を2ヶ月で作るというお題が落ちてきた。「一応、私の肩書きデータサイエンティストなので、正直インフラエンジニア仕事じゃねと思ったけど、まあやるかということでやりました(笑)」(林

    Retty林田さんが語る「分析基盤におけるAWS活用術」
    taro-is
    taro-is 2017/12/19
    フロントはやっぱりTableauになるのか…
  • 1