Partitioned TableをリカバリーするためにAthena上で実行していたMSCK REPAIR TABLEをGlue Jobで実行できるようになるまでの試行錯誤を書きました。 はじめに Athenaで更新されていないPartitioned Tableを扱う場合には事前にMSCK REPAIR TABLE ${TABLE}のSQL文を実行する必要があります。これを手作業で行っていましたが、該当のテーブル作成を実行しているGlue Jobにてまとめて行うことで自動化を検討しました。 結果として意図した動作に到達できましたが、追加した処理が想定どおりの動作にならなかったり、正常に完了せずエラーになり続けたりと悩まされました。振り返りとしてハマったことも含めて書き出してみました。 尚、コードはScalaを前提としていますが、Pythonを使う場合も大体似たような書き方になると思われます
