タグ

ブックマーク / zenn.dev/jimatomo (3)

  • Step FunctionsとECSでELTパイプラインを作ってみる(dbt)

    完成しました(2022/05/07) データパイプラインをサーバレスにしたい ELTとdbtについて データ活用基盤の役割の一つはデータを集めてきてデータマートまで加工していくことです。従来はストレージが高価であったりしたこともあり、連携段階で加工しておくことでストレージのコストを抑えたることが可能なETLが主流でしたが、近年アーキテクチャの進化を受けて連携時はほぼ無加工で連携後に加工をするELTが注目されています。 そんなデータエンジニアリングの世界観が広まる中で私が注目しているのはdbt (data build tool) というELTのTを担うOSSです。 ELTだからこそのサーバレス化する意味がある ELTの良いところはSQLベースでデータ変換のパイプラインを実装するので、SnowflakeのようなクラウドDWHのパワーを使い倒せるという点です(他にもExtract/Loadがシン

    Step FunctionsとECSでELTパイプラインを作ってみる(dbt)
  • dbtとAWSとサーバレス

    新しいデータパイプライン構築方法の潮流であるELT。そのELTのTを担うOSSであるdbtをコンテナ化してサーバレスの基盤でデータパイプラインを実行することができるハンズオンを用意しました。触って学んでdbtとコンテナとサーバレス技術を身に着けてデータエンジニアとして成長しましょう!

    dbtとAWSとサーバレス
  • 私が妄想している最強のデータ基盤2023

    新年になったので今年のやりたいことをまとめようと思いたち筆をとっています。単にやりたいこと書いてもただのポエムになってしまうので、私が今時点で妄想している最強のデータ基盤を描いて、その中でまだ触ったことのない技術を今年触っていこうという意気込みを最後に書こうと思います(意気込みだけにならないように頑張りたいです!) まだ触ったことないものもあるので妄想しているレベルです。 アーキテクチャ図 まず最初に結論から書いていきます。 なぜこのアーキテクチャが最強と思うのか データ基盤として機能を分けると以下の6つの領域に分かれると思っています(もう少し細かく分けることもできたりします。例えばDMBOKとかではホイール図で11の領域に分けたりしています) データ基盤の領域 主に関連するDMBOKの知識領域 主担当

    私が妄想している最強のデータ基盤2023
  • 1