EMR (Amazon Elastic MatReduce)ではHive用のメタストア(MySQL)がセットされているが、外部メタストアを利用すれば、EMRを起動していないときでもメタストアの情報を別途保持しておくことができて再利用可能、というメリットがある。というわけで、メタストアとしてRDSを使ってみる。 1. AWSコンソールから、RDSをシングルで起動する。RDSの起動方法は割愛(カテゴリAmazon EMRにて投稿してます)。マシンタイプはマイクロでOK。 2. hive-default.xmlをローカルで編集。書く内容は、マシン上でMySQLをメタストアとする場合と変わらない。javax.jdo.option.ConnectionURLに、上記で作成したRDSのエンドポイントを記載する。適当に名前を付けてS3にUplodadしておく。ここではmy-hive-site.xmlとす