dbtの人気記事 220件 - はてなブックマーク

1 - 40 件 / 220件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

dbtの検索結果1 - 40 件 / 220件

dbtに関するエントリは220件あります。データ、 data、開発などが関連タグです。人気エントリには『デジタル庁のデータ分析基盤「sukuna」｜デジタル庁』などがあります。

デジタル庁のデータ分析基盤「sukuna」｜デジタル庁
- 623 users
- digital-gov.note.jp
- テクノロジー
- 2023/06/27
はじめまして。デジタル庁ファクト＆データユニット所属、データエンジニアの長谷川です。本記事ではデジタル庁内でデータ活用を推進するための組織と分析基盤についてご紹介します。これまでのデジタル庁noteと比べると、技術寄りの話題が多い記事となりますが、庁内のデータ活用に興味のある方はぜひご覧ください。デジタル庁のデータ活用組織「ファクト＆データユニット」ファクト＆データユニットとはデジタル庁の特徴の一つに、デジタル分野において各種の専門性をもつ「民間専門人材」が多く所属していることが挙げられます。民間の専門人材は、デザイン、プロダクトマネジメント、エンジニアリングなど、領域ごとに「ユニット」と呼ばれる組織を構成しており（参考：デジタル庁 - 組織情報）、必要に応じてさまざまなプロジェクトにアサインされて業務を遂行する、人材プールのような役割を果たしています。ファクト＆データユニットも
- データ
- あとで読む
- 統計
- GCP
- data
- 分析
- 行政
- cloud
- データ分析
- bigquery
データエンジニア道の俺のバイブル
- 434 users
- zenn.dev/pei0804
- テクノロジー
- 2023/01/03
先人の知恵に学ぶデータエンジニア道で、本当に良かった！読み物を、不定期に追記していく。 A Beginner’s Guide to Data Engineering — Part I データエンジニアをこれから始める人に、必ず薦める記事。データエンジニアの基本を学べるかつ、どういう世界に広がっていくのかまで、一気に学べるのでとても良い。 Functional Data Engineering — a modern paradigm for batch data processing 関数型パラダイムを使ったデータパイプラインの構築方法。これを初めて読んだ時の衝撃は今でも忘れないし、フルスクラッチからdbtを使ったデータパイプラインになっても健在な設計手法。 Engineers Shouldn’t Write ETL: A Guide to Building a High Function
モデリングはキラキラ技術より地味だが役に立つ / modeling-over-shiny-tech
- 421 users
- speakerdeck.com/pei0804
- テクノロジー
- 2022/08/19
# Event データモデリングとデータ基盤の構築・運用（第14回ちゅらコラボ）CARTA HOLDINGS x ちゅらデータ合同イベント https://churadata.connpass.com/event/254417/ ぼくのかんがえる最高のレポーティング基盤 …
注目のITサービスを支えるアーキテクチャ特集技術選定のポイントと今後の展望 - Findy Tools
- 318 users
- findy-tools.io
- テクノロジー
- 2024/05/28
公開日 2024/05/28更新日 2024/12/02注目のITサービスを支えるアーキテクチャ特集技術選定のポイントと今後の展望現代のITサービスは、ユーザーに高品質で安定した体験を提供するために、より効率的で柔軟な技術選定が不可欠です。本特集では、注目企業のシステムアーキテクチャ設計に携わるエンジニアの方々より、それぞれの技術選定における工夫と、未来を見据えた展望についてご寄稿いただいています。各企業がどのように課題を乗り越え、開発生産性や品質を向上させるためにどのようなアプローチを採用しているのかーこの記事を通じて、実際の現場で活用される最先端の技術や戦略を学び、皆さんのプロジェクトに役立つ洞察を得ていただければ幸いです。 ※ご紹介はサービス名のアルファベット順となっております airCloset - 株式会社エアークローゼット会員限定コンテンツ無料登録してアーキテクチャ

データ分析基盤まとめ（随時更新）
- 306 users
- zenn.dev/yuichi_dev
- テクノロジー
- 2024/03/15
はじめにデータ分析基盤の資料を力尽きるまで追記していきます。構成図にあるアイコンや記事の内容から技術要素を調べて記載していますが、不明分は未記載にしています。修正のコメント頂ければ助かります。この記事追加してっていう要望も歓迎いたします。テンプレート 2025年 2024/09/12 : 株式会社朝日新聞社データソース : Google Analytics、Adobe Analytics、Amazon S3、Amazon RDS データ処理 : TROCCO、BigQuery アウトプット :Tableau、Looker Studio 2024/09/12 : 株式会社CARTA MARKETING FIRM データソース : Amazon EC2、Amazon S3 データ処理 : Fivetran、Snowflake、dbt、AWS Step Functions、Element
- データ分析
- あとで読む
- データ
- 分析
- 基盤
- データ基盤
- まとめ
- BigQuery
- 統計
- AWS
[レポート]みんなの考えた最強のデータアーキテクチャ #datatechjp | DevelopersIO
- 198 users
- dev.classmethod.jp
- テクノロジー
- 2022/11/08
さがらです。 11月8日20時～22時に、datatech-jp(データエンジニアリング関係のコミュニティ)主催でみんなの考えた最強のデータアーキテクチャというイベントが開催されました。本記事はこのイベントのレポートブログとなります。イベント概要 ※connpassより引用 datatech-jpで集ったデータエンジニアが、それぞれみんなの考えた最強のデータアーキテクチャを紹介し合うという夢のような企画が実現しました！たくさんの新しいプロダクトが群雄割拠する現在、モダンデータスタックなどという言葉も登場しています。今こそ、どんなプロダクトを選び、どのようなデータ基盤を作れば、効率的にやりたいことが実現できるのか。 5人の猛者からおすすめの構成をご紹介いただきながら、参加者のみなさんとも一緒に考えていく時間としたいと思います。おまけ：当イベントの応募者数このイベントですが、なんと
dbtで見やすいER図を生成する - yasuhisa's blog
- 196 users
- www.yasuhisay.info
- テクノロジー
- 2024/02/03
背景: dbtを使っていてもER図は欲しい! どうやってER図を生成するかどうやってER図を見やすくするかまとめ背景: dbtを使っていてもER図は欲しい! dbtはモデル間のリネージなど可視化が得意なツールではありますが、万能なわけではありません。モデルの生成過程などはリネージで担保できますが、分析時に「どれとどのモデルがJOINできて、JOINする際のキーはこれを使って」というER図で扱うような可視化はディフォルトではできません。 DWHを作っている側からすると「このテーブルはあの辺のテーブルと一緒に使うと便利で、いつもあのキーでJOINして」というのが頭の中に入っていることが多いため、ER図がなくてもどうにかなることも多いでしょう。しかし、分析に慣れていない人や分析に慣れている人であっても、普段と異なるドメインのテーブルを触るときはER図が提供してくれる情報は有用です。ちなみに
- dbt
- あとで読む
- 設計
- DB
- markdown
- UML
- database
300万テーブルのデータ流通を支えるエンジニアリング #GoogleCloud #GoogleCloudDay / 20230523
- 168 users
- speakerdeck.com/kazaneya
- テクノロジー
- 2023/06/09
テクノロジーカンファレンス「Google Cloud Day ’23 Tour in TOKYO」の登壇資料です。詳細は当社ニュースをご参照ください。 https://kazaneya.com/5a50c1c1bb7b42f1bd9eb7b35d813ba1 --- スモールチームで 300 …
- GCP
- あとで読む
- BigQuery
- データベース
- データ
- data
- 技術
使われないものを作るな！出口から作るデータ分析基盤 / Data Platform Development Starting from the User Needs
- 154 users
- speakerdeck.com/amaotone
- テクノロジー
- 2024/05/16
本資料は Tech Play イベント『データ基盤運用の工数削減に効いた俺的ベストプラクティスデータマネジメントの勘所』での登壇資料です。 https://techplay.jp/event/940296 データ基盤を構築する際、多くの人が最初にdbt、BigQuery、troccoといったツ…
アナリスト出身の人にバッチ処理を書いてもらう際にレクチャー & サポートしたことメモ - yasuhisa's blog
- 153 users
- www.yasuhisay.info
- テクノロジー
- 2025/02/11
あまりよくある話ではないと思うんですが、アナリスト/Analytics Engineerの人にバッチ処理を書いてもらう機会がありました。基本的にはSQLを普段書かれていて*1、場合によってはTerraformを少し書くこともあるというバックグラウンドの方です。これに対して私はレクチャーやサポートする形になったので、メンター的でどういうことを考えていたかをこのエントリでは書こうと思います。対象のタスクレクチャーしたこと Step by Stepで実装する APIやjqに慣れる Dockerfileを使って環境構築する正常系を実装する適切な関数やクラスに分割するコマンドライン引数や環境変数を使う型アノテーションを付ける loggerについて知る異常系を考慮するテストどうする問題脱線バッチ処理をアナリスト出身の人に書いてもらうのは適切か? バッチ処理初心者とLLMの付き合い方
DWHにおけるデータモデリングで大事にしている考え方
- 127 users
- stable.co.jp
- テクノロジー
- 2024/02/02
こんにちは。データエンジニアリングの支援を行っているstable株式会社の代表の宮﨑（@ikki_mz）です。弊社では、クライアント社内のデータウェアハウス（DWH）におけるデータモデリングをサポート...
ネットスーパーにおける商品在庫データのアプリケーション構築事例
- 123 users
- speakerdeck.com/10xinc
- テクノロジー
- 2022/11/11
テストの完了をゴールにしない！～仮説検証を繰り返し、開発・QA・ユーザーが交流しながら開発することで見えてくる理想の姿～ - #RSGT2024 #DevSumi / Shift left and Shift right
- 設計
- あとで読む
- BigQuery
- データ
- テスト
- システム
- 開発
dbt導入によるデータマート整備 - ZOZO TECH BLOG
- 107 users
- techblog.zozo.com
- テクノロジー
- 2024/03/05
はじめにこんにちは、ML・データ部推薦基盤ブロックの栁澤（@i_125）です。私はZOZOのデータ基盤におけるデータガバナンス強化を実現するために、Analytics Engineerとして複数の部門を跨ぐプロジェクトチームに参加しています。本記事ではZOZOにおけるデータガバナンス上の課題と、その課題の解決策の1つとしてdbtを導入した話をご紹介します。目次はじめに目次背景課題データマートの乱立集計定義のばらつき依存関係の洗い出しが困難データモデリングツールの比較検討データ変換に関する要件データモデリングツールの選定レイヤリングによる責務の分離実装方針今後の展望 dbtモデルを開発する上で工夫したこと環境の分離背景工夫したことダミーデータセットの生成背景工夫したこと SQLFluffを使ったフォーマット統一依存モデルを含むテスト dbt Doc
- dbt
- あとで読む
- ZOZO
- data
- development
データ基盤のためのリーダブルSQL
- 95 users
- zenn.dev/tenajima
- テクノロジー
- 2024/05/21
これは何？私tenajimaがデータ基盤のパイプラインを作るとき、レビューするときに意識している点を言語化したものですデータ基盤を作る上での考え方の一つに役立てていただければ幸いですこの記事の前提 dbtを使ったデータ基盤構築を念頭に置いて書いています、dbtの記法が出てきます CTEsが使える環境を想定しています記事内でデータエンジニアもアナリティクスエンジニアも総称してデータエンジニアと呼んでいますデータ基盤を「使う側」のクエリと「作る側」のクエリの違い最近ではファーストキャリアからデータエンジニアの方も出てきているかもしれませんが、データサイエンティスト、アナリスト、ソフトウェアエンジニアを経験してデータエンジニアを行っている人が一般的と考えています。特にデータサイエンティスト、アナリストからデータエンジニアへの転向は私の周りでは多いように感じており、その方達は(過去の
- sql
- あとで読む
- dbt
- 読んだ
- データ
- programming
dbtを導入して小規模チームでも運用可能なデータマネジメント体制を構築した話 - High Link テックブログ
- 90 users
- tech.high-link.co.jp
- テクノロジー
- 2022/09/09
はじめにこんにちは。株式会社High Linkのデータユニットマネージャーの芦川 (@assy) です。私たちのチームでは、データを強みとした事業価値創出を促進するために、データ基盤の整備やデータマネジメント、全社的なデータ利活用レベルの引き上げに取り組んでいます。データマネジメントをしていると、「誰が作ったかわからない野良のテーブルが乱立している」ことや「BigQueryコンソール上でviewを定義してしまってコードレビューができない」さらには、「テーブル間の依存関係がわからず削除できない」といった課題にぶつかる方は多いんじゃないでしょうか。私たちもまさにこのような問題に直面し、導入したのがdbtです。今回は、dbtの導入に至る経緯や選定の理由、dbtをどう活用しているのかといった話を共有させて頂こうと思います。私たちのようにデータマネジメントにがっつり人的リソースを割けない
ぼくのかんがえる最高のレポーティング基盤 @AWSで実践！Analytics modernization
- 86 users
- speakerdeck.com/pei0804
- テクノロジー
- 2021/06/08
VOYAGE GROUP Zucks DSPレポーティング基盤をどのようにして作ったかの話。 https://pages.awscloud.com/JAPAN-event-OE-20210624-AnalyticsModernization-reg-event.html ディメンションモデリング…
- aws
- アーキテクチャ
- ログ
- あとで読む
- データ
- analytics
- レポート
- dev
派生先テーブルの参照回数も考慮して安全にテーブルを撤退する - yasuhisa's blog
- 85 users
- www.yasuhisay.info
- テクノロジー
- 2023/10/09
3行まとめテーブルの撤退時にはテーブルの参照回数を見ることが多いと思いますが、テーブル単独の参照回数を見るだけだと不十分なことが多いです派生先のテーブルの参照回数まで考慮すると、テーブルが撤退できるか安全に判断することができますリネージ上の親子関係をWITH RECURSIVEで考慮しながら、累積参照回数をSQLで導出できるようにし、安全にテーブル撤退を判断できるようにしました 3行まとめ背景: テーブルの撤退にはテーブル単独の参照回数を見るだけだと不十分アイディア: 累積参照回数を計算する実装テーブル間の親子関係を抽出する WITH RECURSIVEでテーブルの親子関係を辿るテーブルの親子関係を考慮しながら、累積参照回数を計算するまとめ背景: テーブルの撤退にはテーブル単独の参照回数を見るだけだと不十分データエンジニアやアナリティクスエンジニアの仕事をしていると、
- BigQuery
- あとで読む
- SQL
- DB
- development
- 資料
dbtで始めるデータパイプライン構築〜入門から実践〜
- 66 users
- zenn.dev/dbt_tokyo
- テクノロジー
- 2021/12/02
事業会社においてBIやレポート用の分析を担当しているが以下のような状況に該当する人に向けたデータパイプライン構築の入門のための資料です 🧑🏻‍🦱「BigQuery等のView機能を活用しているが、データの流れを追うのが困難な状態になってしまっている、クエリの実行に時間がかかりBIツールが使いづらい」 👩🏻「専任のデータエンジニアがおらず、前処理をpython等で処理したりするのがリソース調整的に大変」 👱🏻‍♂️「ロードされたデータに重複があったり、過不足があったりしてデータの品質が担保できていない」 🧑🏻‍🦰「Digdagやluigiといったデータ変換ツールの独自の仕様を理解しきれておらず使いこなせていない」 ※現時点ではBigQueryを中心に記事を構成してあります、SnowflakeやAmazon Redshift等の様々な分析基盤でもdbtは対応可能です
- dbt
- BigQuery
- データ分析
- GCP
- python
- あとで読む
- sql
- data
- データ
スプレッドシートを活用して組織横断的にテーブル・カラムの説明文を入力した話 - High Link テックブログ
- 62 users
- tech.high-link.co.jp
- 暮らし
- 2023/04/24
こんにちは。株式会社High Link で業務委託として働いている、データエンジニアのikki（@ikki_mz）です。私たちデータチームでは、「データの民主化」を推進しており、全社員がデータ利活用を行えるように、dbtを用いた分析基盤の整備に取り組んでいます。 tech.high-link.co.jp データの民主化を推進していくにあたり、テーブル・カラムの説明文は非常に重要な役割を占めます。テーブルやカラムが何を意味しているかの説明は、分析をする上ではとても重要です。しかし、このテーブルやカラムの説明はなかなか厄介で、データベースを開発した開発エンジニアとコミュニケーションをとらないと、説明文を正確に書くことができません。そこで私たちは、dbt・スプレッドシートを使って、テーブルやカラムの説明文の入力をするという、組織横断的なプロジェクトを実施しました。背景と課題 dbt de
- dbt
- あとで読む
- database
- 開発
- 仕事
dbtを触ってみた感想 - yasuhisa's blog
- 56 users
- www.yasuhisay.info
- テクノロジー
- 2021/07/25
データエンジニア系の勉強会で最近dbtがぱらぱらと話題に出てくるようになった & 4連休ということで、夏休みの自由研究がてらdbtを触ってみました。書いてる人のバックグラウンドは以下の通り。 DWHやデータマートの構築のためのETLツールを模索中(特にTの部分) プライベートではDataformを使っている前職でも仕事の一部で使っていた開発効率を計測するデータ基盤の管理にDataformを使ってみた - yasuhisa's blog 定期バッチ処理はArgo Workflows on GKEでやっている触ってみないと肌感とか自分で運用できるかのイメージが湧かないのでね。 Dataformとの比較細かいノウハウ手元や本番環境での動作 Argo Workflowとの連携環境によってDWHの提供するバージョンを差し替える DWHやデータマートの外の情報をデータリネージに加える既存
- dbt
- bigquery
- データ基盤
- データ
- SQL
- あとで読む
dbtを使ったELTデータパイプライン構築と運用事例 - DataEngineeringStudy #13
- 54 users
- speakerdeck.com/10xinc
- テクノロジー
- 2022/04/07
DataEngineeringStudy #13に10Xの瀧本が登壇した際の資料です。
- dbt
- データ
- あとで読む
- sql
- ツール
タイミーデータ基盤のモデリング設計について - Timee Product Team Blog
- 54 users
- tech.timee.co.jp
- テクノロジー
- 2023/10/23
はじめにこんにちはokodoonですタイミーのデータ基盤に対してデータモデリングを始めてしばらく経ったので、現状の全体構成を紹介したいと思います全体構成弊社のBigQueryは以下の4層にレイヤリングされていますそれぞれの役割は以下のような切り分けになっていますレイヤー名役割データレイク層複数ソースシステムのデータを未加工の状態でBigQueryにロードする宛先 dbt snapshotによるソースの履歴化ステージング層複数ソースシステムのデータを共通した処理でクレンジングする層 DWH層ソースシステムのデータ形式を分析に適した形に変換する層ディメンショナルモデリング/ログテーブルをイベント単位に分割/その他便利テーブル作成データマート層特定用途に対して1:1で作成されたテーブル群を格納する層ダッシュボード用テーブル/Looker用テーブル/GoogleSh
- DWH
- あとで読む
- 設計
- DB
- データ
事業計画を立てる上で必要なプロセスをシステム化し改善した話 - pixiv inside
- 52 users
- inside.pixiv.blog
- テクノロジー
- 2024/07/22
こんにちは。プラットフォーム開発部兼財務データ企画部のshigeniiと申します。普段はデータ基盤の運用保守、および、全社的なデータ活用やデータ駆動推進を担当しています。今回は、財務に関する情報の収集からその可視化までの過程をシステム化することで、事業計画や予算策定のプロセス改善に結び付けた我々の取り組みについて、システム化に焦点を当てながら書き綴りたいと思います。この記事がバックオフィス業務において、同じような課題を抱えている方に少しでもご参考になれば幸いです。経緯財務レポート可視化プロジェクトシステム化にあたっての具体的な取り組み Before After システム化にあたっての課題今回の対応全体的なシステム構成財務レポートを作るまでのながれ説明1．各業務システムのデータを取得説明2．マスタ情報の取得・作成説明3．データの加工・突合機能説明4．データに対するセ
全社横断データ基盤へdbt導入を進めている話 - Sansan Tech Blog
- 51 users
- buildersbox.corp-sansan.com
- テクノロジー
- 2023/12/16
こんにちは。研究開発部 Architectグループの中村です。本記事は Sansan Advent Calendar 2023 の16日目の記事です。今回は、私達のチームで開発&運用している全社横断データ分析基盤のデータレイヤの再設計、及びdbtの導入を進めているという事例について紹介します。既存のデータ基盤に対して、dbtの導入を検討されている方の参考になれば幸いです。（本稿ではdbtとはについては触れませんので、ご了承ください） TL;DR 歴史的経緯全社横断データ基盤が生まれる前全社横断データ基盤立ち上げ期課題立ち上げ期に作られたデータマートがカオスに・・・課題の解決に向けてデータレイヤの再設計 Transformツールの選定 dbtへの移行戦略その他dbt移行におけるTips チームでの開発の標準化 Cosmosの導入検証データカタログのホスティングまと
- dbt
- あとで読む
- 設計
- data
- データ
- ツール
個人的なdbtの推しポイントを書いてみる - yasuhisa's blog
- 51 users
- www.yasuhisay.info
- テクノロジー
- 2024/02/12
dbtや同じ系統のDataformなど、ELTの特にTransform部分に強みを持つツールを使い始めて大体3年になる。主観だけど、それなりに使い倒している部類だと思う。開発効率を計測するデータ基盤の管理にDataformを使ってみた - yasuhisa's blog dbtを触ってみた感想 - yasuhisa's blog dbt カテゴリーの記事一覧 - yasuhisa's blog これらのツールで巷でよく言われるデータリネージの可視化ができるデータに対するテストが簡単に書けるエンジニア以外の人ともコラボレーションしやすいあたりの話は耳にタコができるくらい聞いていると思うので、ニッチではあるもののそれ以外のdbtの個人的に推しなポイントをダラダラと書いてみたいと思う。データエンジニアやデータガバナンスを推進する人には共感してもらえる内容かもしれない。推しポイント:
- dbt
- あとで読む
- db
- data
小さな分析チームで始めるマイクロデータメッシュ
- 49 users
- zenn.dev/mjunya1030
- テクノロジー
- 2023/02/04
一つのデータパイプラインの中で、やりたいこと毎に小さいパイプラインを作るデータ変換処理のパイプラインと言うのは、放置しているとどんどん複雑になる傾向にあります。そこで、ある程度統制するため、層に分けるアプローチがよくとられています。しかし、この層に分けると言うのは案外難しく、データ更新の頻度や鮮度の管理に課題があります。今回はやりたい事ごとに都度パイプラインを作り、その中で他にも使えるテーブルを再利用してテーブルの乱立を防ぐ、方法を考えました。このアプローチの実現にはいくつか制約があります。この記事では、直面している課題、アプローチの利点、そしてdbtを用いた実装方針について記載していきます。この手法が着目している課題データメッシュと言うと、大企業におけるデータマネジメントに近い印象を持つと思います。上記の記事では、大企業における部署のような単位をドメインとしているので、組
【連載】データ分析基盤をdbt・Snowflakeに移行する【設計・実装編】 - Algoage Tech Blog
- 47 users
- tech.algoage.dmm.com
- テクノロジー
- 2023/10/04
こんにちは、Ops-dataチームの上村(@contradiction29) です。以前、弊社内で運用されているデータ分析基盤を移行するにあたり、設計の方針を練る記事を投稿しました。 tech.algoage.dmm.com 今回はその続きとして、移行プロジェクトの実際の進行に焦点を当てて記事を書いていきたいと思います。はじめにこれまでのあらすじ：運用していく中でつらみがたまってきた弊社のデータ分析基盤。開発しづらいし、運用もつらいし、何よりこのまま運用を続ければ確実に停止してしてしまう。End of Service Life (EOSL) は目前に迫っています。移行するしかない状況です。とはいっても、単純に移行するだけでは、現場のアナリストやエンジニア、社内ユーザー、そしてその先にあるクライアントのニーズに応え、事業価値に貢献することはできません。真の「価値」に貢献するためには「思
- Snowflake
- dbt
- あとで読む
- data
- 設計
- データ
- blog
GeminiでdbtのDescriptionを自動補完したら、2,000件以上のメタデータ整備が1分以内で完了した話 - LegalOn Technologies Engineering Blog
- 44 users
- tech.legalforce.co.jp
- テクノロジー
- 2025/05/22
はじめに株式会社LegalOn Technologiesでアナリティクスエンジニアをしている鈴木です。データ活用の現場では、メタデータの品質が分析や開発の効率を大きく左右します。特に、データベースのカラム定義（description）は、データの意味や使い方を理解する上で重要な役割を果たしています。今回は、Gemini（生成AI）を活用してBigQueryのテーブルdescriptionを半自動補完する取り組みについてご紹介します。この施策により、データの可視性・可読性が向上し、チーム全体のデータ活用効率が改善されました。現在の環境現在のデータウェアハウスを取り巻く環境は以下の構成となっています。 BigQuery上のデータマートを効率的にデータモデリングするツールとしてdbtを採用している dbtにより、dl（データレイク）・dwh（データウェアハウス）・dm（データマート）の
Terraformとdbtを活用してデータ基盤整備の生産性が向上した話
- 43 users
- zenn.dev/shinoki
- テクノロジー
- 2024/03/01
はじめに私が所属しているライフイズテックのデータ基盤グループで、ここ2年ほどでdbtとterraformを活用してDataOpsを進め、データ基盤の整備の生産性が向上した話をまとめます。導入前の状況と課題弊社のデータ基盤ではデータ基盤が綺麗に整備されていることよりも、プロダクトや事業に貢献できているかを重要と考え、まずデータを使える状態にすることを目指したサービスの導入や基盤構築を行いました。考え方としてはこちらの DWHにおけるデータモデリングで大事にしている考え方に書かれている内容に近い考え方になります。そのため、データモデリングの前にRedashやCRM AnalyticsというBIツール向けにデータレイクからデータマートを先に構築していました。 terraformとdbt導入前は、図のような流れで SQLでSnowflake上にDBやスキーマなどを作成 ELTサービスとし
- dbt
- terraform
- あとで読む
- data
vscode-dbt-power-userでdbtの開発やレビューを効率化する - yasuhisa's blog
- 43 users
- www.yasuhisay.info
- テクノロジー
- 2023/07/09
背景 vscode-dbt-power-userがよかったところ定義にさっと行ける / 戻れる(Go to definitionが使える) VSCode内でモデル間のリネージが見れる VSCode内からdbtのモデルをさっと実行できるモデルファイルの単独の実行も簡単コンパイル済みのSQLファイルをさっとプレビューできるまとめ補足: vscode-dbt-power-userの導入方法背景 dbtは前職時代から含めると二年以上使っていて、SQLでDWHやデータマートの開発をしようと思うともはやこれなしでは生きられないくらいには便利になっている。dbtがあっても大変なクエリは大変ではあるが、大変さは大分緩和してくれる。dbtがなくて、1つのSQLが1000行以上あり、中間クエリがテストもされていない、という状況はもう戻りたくない...。 dbtに限らずであるが、コードは書いていると
- dbt
- VSCode
- SQL
- あとで読む
- 開発
dbt docsを使ったデータカタログの運用事例紹介
- 42 users
- speakerdeck.com/10xinc
- テクノロジー
- 2023/07/11
10Xが掲げるオリジナルの品質特性について #nihonbashitesttalk / 10X quality characteristic
- dbt
- あとで読む
- BigQuery
- 運用
- データ
- 統計
dbt導入におけるデータモデリング環境整備 - pixiv inside
- 42 users
- inside.pixiv.blog
- テクノロジー
- 2024/06/18
はじめに初めまして。プラットフォーム開発部にてデータ基盤の整備をしているazukiと申します。今回はdbt(Data build tool)を導入した経緯と非中央集権的なdbtの使い方についてご紹介したいと思います。今回は導入に関してまとめていますので、dbtの運用面の詳細は別記事で解説予定です。データモデリングツール導入の背景ピクシブではプロダクトの多さを理由に非中央集権データ組織を採用しています。ドメインチームがメインでデータの取り組みやデータモデリングを行い、データ駆動推進室やデータ基盤チームはそのサポートや整備を担当しています。その背景に関しては、【PIXIV MEETUP 2023】の方でお話していますのでぜひご覧下さい。 speakerdeck.com 今までBigQueryのデータ加工SQLは自社で開発したツールで管理していました。 pythonから変数埋め込み
月35人以上が開発するUbieのdbt開発のガードレール
- 42 users
- zenn.dev/ubie_dev
- テクノロジー
- 2025/04/15
こんにちは、おきゆきです。Ubieでデータ関連業務を担当しています。 4月9日に開催されたTokyo dbt Meetup #13にて、「dbtとLightdashを社内へ浸透させるまでの取り組み」というテーマで発表させていただきました。当日は多くの方にご参加いただき、たくさんのご質問、誠にありがとうございました！その中で特にコメントが多かったのは、「データエンジニアが1人の状況で、dbtとLightdashを利用する月間PR作成者が35人以上というのは、具体的にどのようにデータマート開発を進めているのか？」「品質はどのように維持しているのか？」「データモデリングの知見はどのように共有しているのか？」といったご質問でした。具体的には、以下のスライドで示した数値についてです。 https://speakerdeck.com/okiyuki99/integrate-dbt-and-ligh
さようなら、謎の数値ズレ。dbtを活用してデータ品質管理をはじめよう
- 40 users
- sotaro-tanaka.medium.com
- テクノロジー
- 2021/06/15
tl;drすべてのデータを高品質に保とうとしない。事業フェーズやプロダクト仕様、マネタイズ方法に応じて、品質を守るべきデータを明確に定義し、「品質が守られた箱の中の世界」を明確にする。データ品質維持の前提は、Single Source of Truth。SSOTなDWHを構築することとセットな取り組みであることが大切。データ品質管理のHowとしては、dbtがおすすめ。not_nullやrelationshipなどdbtがもつtest機能を活用し、データ品質監視を実現しよう。当然、dbtだけでは品質は守られない。Data Meshのような議論から運用体制を考えていく必要もある。聞こえのよい新しいものに踊らされる前に、着実に必要なデータ品質を守っていこうね。こんにちは、こんばんは。Ubie Discoveryのsotaronです。データエンジニアをやったり、小倉唯さんのファンクラブ会員などを
- dbt
- dataQuality
- データ
- BigQuery
- データ分析
- data
- 開発
DWH改善に生かす! 入門elementary - yasuhisa's blog
- 37 users
- www.yasuhisay.info
- テクノロジー
- 2024/01/31
前提: これは何? dbtを使ったデータプロダクトを作っている社内のチームメンバー向けに書いた勉強会用のドキュメントです社外に公開できるように少し抽象化して書いてます DWHに限らずdbtを使ったデータプロダクトで生かせる話ですが、分かりやすさのためにDWHを題材にしています 3行まとめ elementaryはdbtを利用しているデータパイプラインに対してData Observabilityを強化するツールであり、付属のリッチなレポートやSlachへのアラート通知が便利ですしかし、実はelementaryが内部で生成している成果物はDWHの改善に役に立つものがたくさんあります本エントリではelementaryの成果物や役に立つ実例を多めに紹介します前提: これは何? 3行まとめ背景: DWHとデータ品質 Observability / Data Observabilityについて
[レポート] モダンデータウェアハウスにおける「キンボール」〜残す価値のあるもの、ないもの #dbtcoalesce | DevelopersIO
- 36 users
- dev.classmethod.jp
- テクノロジー
- 2021/04/05
大阪オフィスの玉井です。 2020年12月7日〜11日の間、Fishtown Analytics社がcoalesceというオンラインイベントを開催していました（SQLを触っている方はピンとくるイベント名ではないでしょうか）。「Fishtown Analytics社って何やってる会社？」という感じですが、dbtというツールを開発しているベンダーです。dbtについては、下記をご覧ください。今回は、その中からKimball in the context of the modern data warehouse: what's worth keeping, and what's notというセッションを受講したので、レポートを記します。イベント概要公式 Kimball in the context of the modern data warehouse: what's worth kee
データ品質を支えるdbt test ~Ubieの事例を添えて~
- 36 users
- zenn.dev/okiyuki
- テクノロジー
- 2022/12/05
はじめにこんにちは。おきゆきです。現職のUbieでは、Data Analyst / Analytics Engineerとして働いています。（自己紹介ページとTwitterはこちらです) この記事は、dbt Advent Calendar 2022 5日目の記事 / Ubie Engineers & Designers Advent Calendar 2022 5日目の記事です。2つのアドベントカレンダーに関わる dbt×Ubieということで、Ubieの圧倒的なデータ品質を支えるdbt testの事例を紹介します。最近同僚の @jagabass から、Ubieでのデータ品質の重要性とdbtを用いたデータマネジメント領域のさまざまな課題解決事例が紹介されました。この記事は、より具体的なdbt testの例になるかと思います。上記スライドで書いてあるUbieでのデータ品質の重要性を端的にい
- dbt
- あとで読む
- test
- テスト
- データ
- 統計
Elementaryを用いたデータ品質の可視化とデータ基盤の運用改善
- 35 users
- speakerdeck.com/10xinc
- テクノロジー
- 2024/03/20
Tokyo dbt Meetup #8での登壇資料になります。 - https://www.meetup.com/tokyo-dbt-meetup/events/299602585/
- dbt
- あとで読む
- データ
- data
- 資料
dbt (data build tool) を使ってデータをテストする - CUBE SUGAR CONTAINER
- 34 users
- blog.amedama.jp
- テクノロジー
- 2022/02/05
ソフトウェアエンジニアリングの世界では、自動化されたテストを使ってコードの振る舞いを検証するのが当たり前になっている。同じように、データエンジニアリングの世界でも、自動化されたテストを使ってデータの振る舞いを検証するのが望ましい。データをテストするのに使える OSS のフレームワークも、いくつか存在する。今回は、その中でも dbt (data build tool) を使ってデータをテストする方法について見ていく。 dbt 自体はデータのテストを主目的としたツールではないものの、テストに関する機能も備えている。また、dbt には WebUI を備えたマネージドサービスとしての dbt Cloud と、CLI で操作するスタンドアロン版の dbt Core がある。今回扱うのは後者の dbt Core になる。使った環境は次のとおり。 $ sw_vers ProductName:
- dbt
- testing
- テスト
- test
- あとで読む
- データ
- data
dbtのUnit testsを導入してわかったこと - Oisix ra daichi Creator's Blog（オイシックス・ラ・大地クリエイターズブログ）
- 33 users
- creators.oisixradaichi.co.jp
- テクノロジー
- 2024/12/06
はじめに DMO（Data Management Office）でデータプラットフォームセクションを担当しています東條です。データプラットフォームセクションはOisixを中心としたデータ基盤の構築・整備を担当しています。このデータ基盤にはSnowflakeとdbtを使用しています。今回dbt-core v1.8.0で追加されたUnit testsを導入してわかったことを紹介していきます。 dbtのUnit testsとはまずは簡単にdbtのUnit testsを紹介します。dbtのUnit testsはソフトウェア開発において実施されるユニットテストをdbtでも実現できるようにしたものです。dbtの1つのmodelをソフトウェアの最小単位としてとらえて、入力データと期待されるデータを準備します。入力データをテスト対象のmodelが処理し、その出力結果と期待されるデータを比較し検証すること
- テスト
- あとで読む