気にはなってるけど触ってないビッグデータ系のツール・サービスを触る Advent Calendar 2022の#7です。 OpenLineageとMarquezを調べて・触ってみました。 tl;dr OpenLineageはリネージュ登録の標準仕様、Marquezはそのリファレンス実装だよ データがどこから来て、どこに行って、どんな処理を噛ませたかを記録することができるよ 連携できるシステムには注意だよ Airflowは連携できる。Spark・Great Expectatinosはドキュメントにあるけど要注意 OpenLineageとは 公式ページ曰く、 OpenLineage is an open framework for data lineage collection and analysis. At its core is an extensible specification t