タグ

dbtに関するAkinekoのブックマーク (6)

  • コードからdbtを理解する

    パッケージを作りたいとき、バグっぽい挙動に出くわしたとき、単なる知的好奇心…などなど、dbtの裏側のコードを読む機会があるかもしれません。dbtのコードを読むときに、どこを見ればいいのか、どのような構造になっているのか、といったことをいくつかの例と一緒にまとめてみました。 要約 dbt-coreではなく、dbt-bigqueryなどadapter側の実装の方が重要なことが多いです。 アーキテクチャ まずはdbtのアーキテクチャをざっくりと説明します。dbtでは環境構築時にcoreと各DWH用のadapterをインストールしますが、それぞれ以下のような役割を担っています。 dbt-core: CLI等のユーザーインターフェースを担当 dbt-adapters: DWHとの接続を担当する抽象化レイヤー dbt-bigquery など各種adapter: dbt-adaptersを継承した具体的

    コードからdbtを理解する
    Akineko
    Akineko 2024/10/04
  • dbt導入におけるデータモデリング環境整備 - pixiv inside

    はじめに 初めまして。プラットフォーム開発部にてデータ基盤の整備をしているazukiと申します。 今回はdbt(Data build tool)を導入した経緯と非中央集権的なdbtの使い方についてご紹介したいと思います。 今回は導入に関してまとめていますので、dbtの運用面の詳細は別記事で解説予定です。 データモデリングツール導入の背景 ピクシブではプロダクトの多さを理由に非中央集権データ組織を採用しています。 ドメインチームがメインでデータの取り組みやデータモデリングを行い、データ駆動推進室やデータ基盤チームはそのサポートや整備を担当しています。 その背景に関しては、【PIXIV MEETUP 2023】の方でお話していますのでぜひご覧下さい。 speakerdeck.com 今までBigQueryのデータ加工SQLは自社で開発したツールで管理していました。 pythonから変数埋め込み

    dbt導入におけるデータモデリング環境整備 - pixiv inside
  • dbt導入によるデータマート整備 - ZOZO TECH BLOG

    はじめに こんにちは、ML・データ部推薦基盤ブロックの栁澤(@i_125)です。私はZOZOのデータ基盤におけるデータガバナンス強化を実現するために、Analytics Engineerとして複数の部門を跨ぐプロジェクトチームに参加しています。記事ではZOZOにおけるデータガバナンス上の課題と、その課題の解決策の1つとしてdbtを導入した話をご紹介します。 目次 はじめに 目次 背景 課題 データマートの乱立 集計定義のばらつき 依存関係の洗い出しが困難 データモデリングツールの比較検討 データ変換に関する要件 データモデリングツールの選定 レイヤリングによる責務の分離 実装方針 今後の展望 dbtモデルを開発する上で工夫したこと 環境の分離 背景 工夫したこと ダミーデータセットの生成 背景 工夫したこと SQLFluffを使ったフォーマット統一 依存モデルを含むテスト dbt Doc

    dbt導入によるデータマート整備 - ZOZO TECH BLOG
  • Terraformとdbtを活用してデータ基盤整備の生産性が向上した話

    はじめに 私が所属しているライフイズテックのデータ基盤グループで、ここ2年ほどでdbtterraformを活用してDataOpsを進め、データ基盤の整備の生産性が向上した話をまとめます。 導入前の状況と課題 弊社のデータ基盤ではデータ基盤が綺麗に整備されていることよりも、プロダクトや事業に貢献できているかを重要と考え、まずデータを使える状態にすることを目指したサービスの導入や基盤構築を行いました。 考え方としてはこちらの DWHにおけるデータモデリングで大事にしている考え方に書かれている内容に近い考え方になります。 そのため、データモデリングの前にRedashCRM AnalyticsというBIツール向けにデータレイクからデータマートを先に構築していました。 terraformdbt導入前は、図のような流れで SQLでSnowflake上にDBやスキーマなどを作成 ELTサービスとし

    Terraformとdbtを活用してデータ基盤整備の生産性が向上した話
  • DWHにおけるデータモデリングで大事にしている考え方 

    こんにちは。データエンジニアリングの支援を行っているstable株式会社の代表の宮﨑(@ikki_mz)です。弊社では、クライアント社内のデータウェアハウス(DWH)におけるデータモデリングをサポート...

    DWHにおけるデータモデリングで大事にしている考え方 
  • dbtで見やすいER図を生成する - yasuhisa's blog

    背景: dbtを使っていてもER図は欲しい! どうやってER図を生成するか どうやってER図を見やすくするか まとめ 背景: dbtを使っていてもER図は欲しい! dbtはモデル間のリネージなど可視化が得意なツールではありますが、万能なわけではありません。モデルの生成過程などはリネージで担保できますが、分析時に「どれとどのモデルがJOINできて、JOINする際のキーはこれを使って」というER図で扱うような可視化はディフォルトではできません。 DWHを作っている側からすると「このテーブルはあの辺のテーブルと一緒に使うと便利で、いつもあのキーでJOINして」というのが頭の中に入っていることが多いため、ER図がなくてもどうにかなることも多いでしょう。しかし、分析に慣れていない人や分析に慣れている人であっても、普段と異なるドメインのテーブルを触るときはER図が提供してくれる情報は有用です。ちなみに

    dbtで見やすいER図を生成する - yasuhisa's blog
  • 1