はじめに Redshift で遊んでみたいものの、データがないとはじまりません。そこで、AWS の中でも利用頻度の高い ELB のアクセスログを解析対象データとして活用してみたいと思います。 前提 本稿は以下の知識を前提に進めます。セットアップ方法がわからない方は別途、他の資料をあたってください。 Redshift のクラスタ起動方法 Redshift クライアントのセットアップ方法 ELB、および Web サーバのセットアップ方法 ELB アクセスログの有効化 まずは ELB を作成してアクセスログを有効化しましょう。バックエンドの EC2 は適当に apache、nginx あたりを起動しときましょう。しばらくしたら、S3 にログがたまってるはずなので、確認できたらログはOKです。 Redshift のテーブル定義 次に、アクセスログのフォーマットを確認しましょう。1これを元に Red