タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

airflowに関するkmrshntrのブックマーク (1)

  • Apache Airflow で実現するSQL ServerからBigQueryへのデータ同期 | Enigmo Life

    はじめに この記事はEnigmo Advent Calendar 2018の11日目です。 Enigmoでは、データウェアハウス(DWH)としてBigQueryを使っていて、サービスのアクセスログやサイト内の行動ログ、データベースのデータをBigQueryへ集約させています。 データベースからBigQueryへのデータ同期にはApache Airflowを使っていて、今日はその仕組みについて紹介します。 Apache Airflowとは Airflowは、pythonでワークフロー(DAG)を定義すると、そのとおりにタスク(オペレーター) をスケジューリングして起動してくれるツールです。GCPでもGKE上でAirflowを動かすCloud Composerというサービスが提供されていてご存知の方も多いと思います。 データの処理の単位をオペレータで定義し、その処理の依存関係を反映したワークフ

    Apache Airflow で実現するSQL ServerからBigQueryへのデータ同期 | Enigmo Life
  • 1