AWS Glue ジョブを使用してデータを Apache パーケットに変換する方法の概要 Amazon Web Services (AWS) クラウドでは、AWS Glue は完全マネージド型の抽出、変換、読み込み (ETL) サービスです。AWS Glue を使用すると、データの分類、クリーニング、エンリッチメント、さまざまなデータストアやデータストリーム間での確実なデータ移動を費用対効果の高い方法で行うことができます。 このパターンでは、AWS Glue でさまざまなジョブタイプが提供され、3 つの異なるスクリプトを使用して ETL ジョブの作成を示しています。 AWS Glue を使用して Python シェル環境で ETL ジョブを記述できます。マネージド Apache Spark 環境で Python (PySpark) または Scala を使用して、バッチ ETL ジョブとス