Hiveでデータ集計してKPIを定期的にレポーティングしているんですが、それとは別にアドホックにHiveを実行するということはよくありますよね。 例えば企画の人が何かイベントしたのでその効果を知りたいとかですね。 定期的に見たいKPIだったらそれはそれでちゃんと実装してジョブ管理ツールに登録して毎日実行するようにするわけですが、そうでない一時期なケースの話です。 今まではずっと僕のようなデータエンジニアが要件を聞いてHiveQL書いて実行してその結果をメールに添付して返すとかやってたわけです。や、今でもやってますけどね。 で、まあ、そういうアドホックなデータ抽出依頼が増えてきてて、あまりそれにばかり時間を使っているようだとシステムの改善とかそういうさほど緊急ではないけれども重要な仕事がなかなかできないという状況になってました。 そういう状況はよくないし、データ抽出依頼する側が自分でHive