Shared Work Optimizer 少し間が空いてしまいましたが、引き続きHive 4に関するアップデートを紹介していきます。今回はパフォーマンス改善についてまとめてみます。 Hive 4関連記事一覧 Vectorization CBO Shared Work Optimizerの強化 統計情報 ヒストグラム 実行時統計情報の再利用 総評 Hive 4関連記事一覧再掲 Hive 4関連記事一覧 Apache Hive 4: 新しく追加されたUDFの紹介 - おくみん公式ブログ Vectorization Vectorizationは複数行をまとめて処理することでメモリレイアウト含む実行効率を改善する仕組みです。最低限よく使われる機能からvectorizationの対応がスタートし、その後継続的にサポート範囲の拡大やさらなる最適化が行われています。 ざっと見る限り、Hive 3.0.