今回から開発編ということで、いままで開発で得た EMR開発の実践的なところを紹介していきます! 開発編を1回で記事にしてしまうとボリュームが多すぎてしまうので、 基礎編、実装編 と分けることにしました。 早速ですが、 投稿スケジュールを以下に変更させていただきます;; ・11月上旬 ~EMR開発基礎編~ ・11月下旬 ~EMR開発実装編~ ・12月上旬 ~EMR開発_運用編~ ・12月下旬 〜Redshiftについて 今回は、基礎編と題しましてEMR開発における 土台 の部分について書きたいと思います。 はじめに 先ずは、EMRを動かすために必要なものを一通り ・AWSアカウント ・アカウントに紐づくアクセスキー/シークレットキー ・処理対象のデータ ・Hadoopを動かすためのMapReduceコード(Hive/Pigの場合は不要) ・CLIツール(Webコンソールでも代用可能) 以上で