※当ブログではアフィリエイト広告を利用しています。 Apache Hive のテーブルでサポートされているファイルフォーマットのPARQUETは、ファイル単体では中身を確認するのが困難です。 Parquet ファイルを検査できるツール parquet-tools を使って中身を確認してみたので、その方法をメモします。 parquet-tools とは Apache Parquet が公開している Java ベースのコマンドラインツールです。Parquet ファイルの中身・スキーマ・メタ情報などをコマンドラインから簡単に確認することができます。 ソースコードは GitHub で公開されています。 GitHub – apache/parquet-mr at parquet-1.11.x ※2021/01/16追記 masterbranch ではこちらのCommitでparquet-toolsか
![parquet-toolsを使ってParquetファイルの中身やスキーマを確認する方法 | Lancork](https://cdn-ak-scissors.b.st-hatena.com/image/square/8086d732f38902bb85ebd7e07777b6ae9d34d8c6/height=288;version=1;width=512/https%3A%2F%2Fwww.lancork.net%2Fwordpress%2Fwp-content%2Fuploads%2F2016%2F10%2Fapache-parquet-eyecatch.png)