CSVよりも断然良いParquet形式のすゝめ。CSVより読み書き高速でサイズが小さく、型があり、エンコーディング定義があり、nullもある。欠点はデータ構造上ストリーム処理ができない。なるほど。

tmatsuutmatsuu のブックマーク 2023/04/08 20:14

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

Parquet: more than just "Turbo CSV"

    Parquet is an efficient, binary file format for table data. Compared to csv, it is: Quicker to read Quicker to write Smaller On a real world 10 million row financial data table I just tested with p...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう