前回の記事では、Fair Schedulerによる複数ジョブの同時実行についてご紹介しました。今回は、Capacity Schedulerを使った場合について、複数ジョブの同時実行時の挙動を見てみましょう。 HadoopのSchedulerとは複数のジョブを実行する際に、slot数の割り当てを制御し、均等にリソースを割り振ってすべてのジョブが同時に動くようにしたり、優先度の高いジョブから実行させたりといったことを可能にするものです。Scheduler自体の意義については、具体例とともに前回の記事に記載しているので併せて参考にしてください。 Capacity Schedulerとは? Fair Schedulerは、あらかじめ「pool」を定義して、poolごとにslot数の割り当てなどを決め、ジョブの実行時にどのpoolに属するジョブかを指定しました。Capacity Schedulerで