Embulkを使えば、いろいろなデータを簡単にDBに突っ込めるはず。 でも、パフォーマンスが気になるよね。 という訳で、Embulkのパフォーマンスを測ってみることにした。 環境の準備 自分のマシンでパフォーマンステストをすると他のことができなくなってしまうので、AWSを使うことにした。 インスタンスタイプはどうしようか? マルチスレッドを試したいので4CPU欲しい。DB入れるのでメモリもある程度必要だ。ディスクはSSDだとちょっと速過ぎる気がするし、EBSだと遅い気がするし…、とかいろいろ考えて、結局旧世代のm1.xlargeにしてしまった。 OSは自分のマシンに合わせてWindows。JavaとかMySQLもインストールする。 MySQLのチューニングとかは特にしていない(あまり詳しくないので…)。 Embulkもダウンロードした。このときの最新は0.5.0。 embulk-outpu