概要 Apache Icebergは、ストレージ上のファイル群を抽象化し分散クエリエンジンで扱うためのオープンな「テーブルフォーマット」です。本書では、データレイク構築に関する基本的な考え方やIcebergを使うことのメリットといった基本から、Sparkなどの各種分散クエリエンジンにおける実践的な活用方法、そして実運用のためのノウハウまで、豊富なハンズオンとともに解説。次世代のデータ基盤の構築・運用に関わるエンジニア必携の一冊です。 目次 [第1部]Apache Icebergの基本 第1章:データレイクの課題とApache Iceberg Icebergというテーブルフォーマット データレイクのコンセプト データレイクの構成要素 Iceberg登場以前のデータレイクの課題 Icebergによるデータレイクの課題解決 データ基盤におけるIcebergの役割 Icebergを導入する際の注意
