概要 みんな大好きJupyter notebook(python)上で、Pyspark/Cythonを使っていろんなことをやる。とかいう記事を書こうと思ったけど、1記事に詰め込みすぎても醜いし、時間かかって書きかけで放置してしまうので、分割して初歩的なことからはじめようとおもった。 ということで、今回は、Jupyter起動して、sparkSession作るだけにしてみる。 使用バージョン Python == 3.5.1 Spark == 2.0系最新(branch-2.0をビルドしたもの) notebook == 4.2.1 Sparkの最新安定バージョンは、2016-07-01現在1.6.2なんだけど、もうgithubには2.0.0-rc1出てたりする。しかもrc1出て以降も、バグフィックスとかcommitされているので、結局今使っているのは、branch-2.0をビルドしたもの。 ちな