みなさん、こんにちは。 新規開発チームの小田切です。 最近は、仕事の合間にいろいろ検証を行ったりしているのですが、その中で見つけた「SSD Hot S3 Coldパターン」という物があり、気になったので、検証を行ってみました。 「SSD Hot S3 Coldパターン」は簡単にいうと、『SSD(DynamoDB)はストレージ料金がそれなりに高いから、使わないデータは価格の安いS3に移動させちゃいましょう』というパターンです。 イメージは以下のような感じになると思います。 ここで活躍するのが、DynamoDBとS3をつなぐ事の出来るEMR(Hive)です。 Dynamoには、すでにデータが入っている状態として話を進めて行きます。 EMRのJobFlowを作成する まずは、EMRのJobFlowを作成し、HadoopとHiveのインストールされているインスタンスを作成する必要があります。 AW