タグ

2022年12月21日のブックマーク (1件)

  • データ基盤の処理最適化によるBigQueryコスト削減 - エニグモ開発者ブログ

    こんにちは。データエンジニアの谷元です。 この記事は Enigmo Advent Calendar 2022 の21日目の記事です。 目次 はじめに どうしてデータ基盤を最適化する必要があるの? どうしたら改善できるの? 現状のデータ基盤のおさらい 主要なBUYMA基幹データの最新ビューに着目してみる 最新ビューをどう変更するの? システム概要としてはどんな感じ? この方針で思ったこと BQ履歴テーブルの作成方針だけど 当にその方法で改善するの? 運用保守する上で気になっていたこと 見込み効果はどうなの? 実装する上で意識したところ BQ履歴テーブル作成前提となるDAG依存関係 番データを使った確認期間をできるだけ長めにとろう データ品質担保はどうしよっかな 今回は見送ったデータ品質対応 既存の手動実行スクリプトをAirflowに移植しようと思ったら そろそろリリース後の話をしよう 効

    データ基盤の処理最適化によるBigQueryコスト削減 - エニグモ開発者ブログ
    blueskies
    blueskies 2022/12/21
    “懸念してたBQ履歴作成分などで増えるコストもありましたが、それ以上に減少してくれた”