embulk-filter-calcite を使うと任意の SQL を書いてフィルタリングできて圧倒的に便利そうなので、拙作の embulk-filter-row および embulk-filter-column はお役御免にできるかと思って、速度比較をしてみました。 EDIT: (2017/05/19) embulk-filter-calcite 0.1.3 で高速化されたので再計測しました tl; dr embulk-filter-row との比較 Plugin Operator Time took records/s