こんにちは。古橋です。 先日の*1 データ転送ミドルウェア勉強会で、新しいオープンソースツール Embulk をリリースしました。 Embulk, an open-source plugin-based parallel bulk data loader from Sadayuki Furuhashi Embulk は、リアルタイムなログ収集では常識となった fluentd のバッチ版のようなツールで、ファイルやデータベースからデータを吸い出し、別のストレージやデータベースにロードするためのコンパクトなツールです。 fluentd と同様にプラグイン型のアーキテクチャを採用 しているため、RubyやJavaで簡単なコードを書くことで、様々なファイルフォーマットやストレージに対応することができます。一方で fluentd とは異なり、高速性やトランザクション制御、スキーマを使ったデータのバリ
![並列データ転送ツール『Embulk』リリース! - Blog by Sadayuki Furuhashi](https://cdn-ak-scissors.b.st-hatena.com/image/square/33aebe84f7517c81c9141d6b11b2bcfe2520751d/height=288;version=1;width=512/http%3A%2F%2Fgyazo.com%2F533da3c2b5fe8c9ac04ffb650fda3b4b.png)