こんにちは。木内です。 Apache Sparkはいわゆる「スケーラブルな汎用分散処理エンジン」なのですが、実際にはユーザの利用形態はSQLに関する処理や、機械学習などのデータ分析関連に偏っているように思えます。"汎用"というからにはデータ分析に限らずおおよそ並列処理できるようなユースケースにも使用できると Apache Spark の用途の幅が広がるのではないかなと思います。 そこで今回はデータ分析とは全く関係のないような処理をApache Sparkで並列化してみます。 そもそもどんなところで並列処理は使用されているのか 一般的に並列処理が使用されているのはいわゆるスパコンの分野です。私はスパコンのことはよくわからないのですが、線形代数、数値解析といった用途に利用されているようです。例えば Abaqus というソフトウェアは有限要素解析を行うことができるソフトウェアですが、応用分野とし
![普通のPythonスクリプトをSpark化してお手軽並列処理する #spark - クリエーションライン株式会社](https://cdn-ak-scissors.b.st-hatena.com/image/square/a2ed192b7c7d4cb21bd50f71dc60fa06444d0049/height=288;version=1;width=512/https%3A%2F%2Fwww.creationline.com%2Fwp-content%2Fuploads%2F2015%2F06%2Fspark-logo.png)