こんにちは、エンジニアの morux2 です。株式会社メディキューでは、GitHub Actions を用いた CI/CD の実装を担当しています。 今回は、dbt モデルの更新によって生まれるデータの差分を検知する「table diff」の実装をご紹介します。table diff は 本番環境 (main ブランチ) と PR 環境のデータの差分を計算し、結果を PR にコメントします。 table diff で差分を検知する 前提 弊社では、BigQuery にそれぞれの PR 専用の環境を立ち上げています。この仕組みを 「dbt fork」と呼んでいます。(dbt fork の実装詳細は本記事では省略します。) dbt fork によって PR 専用の環境が立ち上がる dbt fork を用いて、PR で変更が入ったデータセットのみを BigQuery の sandbox プロジェク