2013-08-25 fluentd から Amazon Redshift へのデータ投入 試験的に fluentd → Amazon Redshift の流れを作ってみたので、まとめてみます。 全体の流れ fluentd から Redshift にログを送るプラグインとして fluent-plugin-redshift があるようだけど、そちらは使わずに自作する。 基本的な戦略として、 fluentd から S3 へのアップロード S3 から Redshift へのデータロード の二つのステップを分けて考える。S3 へのアップロードは一日一回、Redshift へのロードは週に一回くらいを想定。 データ構造 ログファイルは Redshift 指定の書式に従い、次のようなものを生成する。 2013-08-24 20:01:00|user1|12 2013-08-24 20:01:01|us