先日 columnify という、入力データを Parquet フォーマットに変換するツールがリリースされました。 cf. 軽量な Go 製カラムナフォーマット変換ツール columnify を作った話 - Repro Tech Blog また、fluent-plugin-s3 で compressor として columnify をサポートする話が出ています。1 cf. Add parquet compressor using columnify by okkez · Pull Request #338 · fluent/fluent-plugin-s3 個人的に前々から Docker のログを Parquet フォーマットで S3 に put して Athena で検索できると素敵だなと思っていたので喜ばしいことですね!そんなわけで、Docker のログを fluentd log dr
![Docker のログを columnify で Athena (Presto) に特化した Parquet にする](https://cdn-ak-scissors.b.st-hatena.com/image/square/a82e0de52f730f3bab896207dbadbec30feaa024/height=288;version=1;width=512/https%3A%2F%2Fabicky.net%2Fassets%2F20200826%2Fparquet-format-8653663ebf363ca3749c18dcb7765d53d212464f910e2fc43417256662fa004078927ac182f80ba19a54181722481a4e40f8604c56c955acbbb9fee5fbc65fc8.gif)