Splittable compression そもそもだが圧縮はCPUコストがかかるのでこ全て解決とはならない。CPUバウンドかHDFSバウンドか次第。Bzip2が高圧縮かつSplittableだがCPUコスト高。LZOはindexを別途作成することでSplittableかつCPUコスト低

HHRHHR のブックマーク 2021/05/21 20:37

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

Big Data Articles - dummies

    Big Data Beyond Boundaries: Unstructured Data Orchestration Article / Updated 12-01-2023 Getting the most out of your unstructured data is an essential task for any organization these days, especia...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう