タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

pythonとsparkに関するatm_09_tdのブックマーク (1)

  • PySpark のスクリプトファイルで引数を扱う - CUBE SUGAR CONTAINER

    今回は Apache Spark の Python インターフェースである PySpark について。 PySpark では定型的な作業についてはスクリプトファイル (*.py) にまとめて spark-submit コマンドで実行することになる。 その際に、動作に必要な引数をさばく方法について。 結論から先に書いてしまうと spark-submit コマンドでスクリプトファイルの後ろにアプリケーション用の引数を渡せば良いだけ。 使った環境は次の通り。 Apache Spark は YARN を使って分散環境を構築してある。 $ cat /etc/redhat-release CentOS Linux release 7.4.1708 (Core) $ uname -r 3.10.0-693.17.1.el7.x86_64 $ pyspark --version Welcome to __

    PySpark のスクリプトファイルで引数を扱う - CUBE SUGAR CONTAINER
  • 1