タイトルについて、日本語の情報があまりなかったので書いてみました。 知っておくと、BIツールとの連携が広がるのかな..と思いました。 と言いながら、すべてローカル環境で完結する手順になってます。 HDFSは利用していません。ですが、Sparkクラスタ環境の場合でも大きく手順は変わらないと思います。 私の動作環境は、以下の通りですが、古くても動くと思います。 Mac Mojave jdk 1.8 spark 2.4.0 PostgreSQL 11.2 事前準備 すでに準備ができていれば不要です。 Spark 2.4.0ダウンロード cd ~ # ダウンロード curl -O http://ftp.kddilabs.jp/infosystems/apache/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz # 解凍 tar xvfz spark-