[B! dbt] manboubirdのブックマーク

manboubird id:manboubird

dbtに関するmanboubirdのブックマーク (12)

社内勉強会「Modern Data Stack入門」の内容をブログ化しました - PLAID engineer blog
プレイドの社内向けに行ったModern Data Stack勉強会の内容が好評だったので、データ基盤に携わる方に向けてModern Data Stackの概要、主要サービス、重要だと思うトレンドをまとめました。
manboubird 2024/01/31
dataManagement

modernDataStack

dbt

dataIntegration

ETL
リンク
dbt-BigQuery whitepaper
manboubird 2023/06/24
Build scalable and trustworthy data pipelines with dbt and BigQuery

bigQuery

dbt

googleCloudPlatform

report

whitepaper
リンク
AutomateDV
manboubird 2022/05/12
dataVault

dataModeling

dbt

dataWareHouse
リンク
dbtとBigQueryで始めるData Vault入門
dbt Tokyo Meeup #3の発表内容です発表のアーカイブはこちらから https://youtu.be/SYsiRFR2LGw #dbt_tokyo
manboubird 2022/05/12
dataVault

dataModeling

dbt

bigQuery

slide

dataWareHouse
リンク
dbt (data build tool) を使ってデータをテストする - CUBE SUGAR CONTAINER
ソフトウェアエンジニアリングの世界では、自動化されたテストを使ってコードの振る舞いを検証するのが当たり前になっている。同じように、データエンジニアリングの世界でも、自動化されたテストを使ってデータの振る舞いを検証するのが望ましい。データをテストするのに使える OSS のフレームワークも、いくつか存在する。今回は、その中でも dbt (data build tool) を使ってデータをテストする方法について見ていく。 dbt 自体はデータのテストを主目的としたツールではないものの、テストに関する機能も備えている。また、dbt には WebUI を備えたマネージドサービスとしての dbt Cloud と、CLI で操作するスタンドアロン版の dbt Core がある。今回扱うのは後者の dbt Core になる。使った環境は次のとおり。 $ sw_vers ProductName:
manboubird 2022/02/09
dbt
リンク
さようなら、謎の数値ズレ。dbtを活用してデータ品質管理をはじめよう
tl;drすべてのデータを高品質に保とうとしない。事業フェーズやプロダクト仕様、マネタイズ方法に応じて、品質を守るべきデータを明確に定義し、「品質が守られた箱の中の世界」を明確にする。データ品質維持の前提は、Single Source of Truth。SSOTなDWHを構築することとセットな取り組みであることが大切。データ品質管理のHowとしては、dbtがおすすめ。not_nullやrelationshipなどdbtがもつtest機能を活用し、データ品質監視を実現しよう。当然、dbtだけでは品質は守られない。Data Meshのような議論から運用体制を考えていく必要もある。聞こえのよい新しいものに踊らされる前に、着実に必要なデータ品質を守っていこうね。こんにちは、こんばんは。Ubie Discoveryのsotaronです。データエンジニアをやったり、小倉唯さんのファンクラブ会員などを
manboubird 2021/06/15
dbt

dataQuality
リンク
How to Build a Community: Starting with "why?". | Claire Carroll
My origin story In November 2018, I moved from Sydney to the US to take on a role managing the dbt community. I’d been a member of the community for the two years prior, and in that time had gone from a data analyst who knew enough SQL to be dangerous, to someone who understood the data space deeply enough that I wanted a new challenge. And I’d learned almost everything about data from the dbt com
manboubird 2021/03/06
dbt

oss
リンク
Why DBT will one day be bigger than Spark
manboubird 2021/02/19
dbt
リンク
dbtとDataformを比較し、dbtを使うことにした - Attsun blog
TL;DRdbt, Dataformについて簡単に紹介dbtDataform比較対応するプラットフォーム主要な機能外部ツールとの接続性運用時のあれこれ両者のPros/Consまとめ私たちの選択どちらを使うべきなのか？選ばれたのは、dbtでしたまとめ最近、業務でDWH / Datamartの整備やデータ品質の担保を効率的に行いたくなる事情があり、調査したところdbtとDataformがツールとして有力そうだったので、比較してみました。 TL;DRdbtは機能が充実しており、カスタマイズするポイントも多く様々な要件に対応できそうです。反面、理解し使いこなすための学習コストがかかります。DataformはWebビューによる開発体験が非常に良いです。機能もほとんどはわかりやすく、迷うことも少ないです。一方、dbtに比較して融通はききづらいです。どちらも十分な機能は備えている素晴らしいツールだと感じ
manboubird 2021/02/13
dbt

dataform

workflowScheduler
リンク
Dawn of DataOps: Can We Build a 100% Serverless ETL Following CI/CD Principles?
manboubird 2020/10/11
bigQuery

dbt

workflow

sql

etl

gke

kubernetes
リンク
5 reasons why BigQuery users should use dbt
How do you implement and test data pipelines with BigQuery to create intermediate tables and manage metadata and data discovery? I used to use Apache Airflow’s operators with BigQuery. However, I basically need to implement code in python and manage the dependencies between BigQuery tables manually. As well as, actually, apache airflow enables us to test BigQuery tables with the CheckOperator . Bu
manboubird 2020/08/05
dbt

bigQuery
リンク
Get started with BigQuery and dbt, the easy way
manboubird 2020/08/01
dbt

bigQuery
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx