背景 数万件のバッチ処理を回したいのだけど、シーケンシャルにしか処理されず時間がかかってしょうがないってことありますよね。 自分はこの前そうでした。 手っ取り早くマルチプロセスにするためのバッチを書いたら思いのほか使い勝手が良かったのでこちらにメモって置くことにします。 環境 Centos7 Perl5.x やりたいこと 数万件のデータ処理 1件の処理自体はコマンド一発 入力データは1ファイルに纏めて、各プロセスが参照されるようにしたい 非エンジニアでも簡単にプロセス数を調整したい 個人的な趣味によりPerlで実装したけどなんでも良い アプローチ bashでマルチプロセス処理をさせる簡単な方法は&を使ってバックグラウンド処理させたり、xargs -Pを使う方法があるけど、今回は入力データは1ファイルにまとめておきたく、ロック処理が必要なため手組みで実装することにした。 処理としてはシンプル
