データ分析をしている人にとっては,データのクオリティを日々モニタリングするのは頭痛の種です.最近のシリコンバレーでは,Data Engineer とは別に Data Quality Engineer というポジションで募集をしている企業もたまに見かけます.それぐらいデータの「質」には,気を配る必要がありリソースが掛かる分野といえるでしょう.とは言え,専任のポジションを設けるのはなかなか難しいので,それでもできるだけ簡単にモニターリングしたいです. Airflow と Slack を組み合わせることで,データのクリティを日々モニタリングすることができます.データエンジニアリングにユニットテスト的な概念を持ち込めないかと模索してきましたが,Airflow + Slack は個人的には一つの理想形と言えます. Apache Airflow とは? Apache Airflow は,プログラムでジ