こんにちは。AI・機械学習チームの高田です。 他部署からスプレッドシートでデータを受け取って、社内のDWHにあるデータと突き合わせながら探索的に分析したい。こういう場面で毎回環境構築するのは手間なので、さっと始められるEDA環境がほしいと思っていました。DuckDB + Taskfileの組み合わせがちょうどよかったので紹介したいと思います。 DuckDBが解決すること BQ + GSSを1つのSQLで横断する なぜBQ側からGSSを直接読まないのか ローカルキャッシュで高速化 & BQ課金ゼロ 出力の柔軟性 Taskfileで組む軽量ワークフロー なぜTaskfileか サンプルプロジェクトを作ってみた BQからデータを取得してParquetに保存する GSSの作品リストとBQの単語データをJOINして集計する Taskfile.ymlの構成 キャッシュ戦略をTaskfileで実装する

