CakePHPをよく使うので、CakePHPで動かせるPHPクローラーを探していたところ、よさげなものを発見。 その名も「PHPCrawl」 まずはPHPCrawlのインストールから。 sourceforgeからダウンロードします。 今回使用したのは、最新版(2014/1/10時点)の0.81です。 CakePHPのバージョンはこれまた最新版(安定版)の2.4.4です。 zipファイルをダウンロードして解凍すると、サンプルプログラムが付いています。 トップディレクトリにある「multiprocessing_example.php」を使わせてもらいます。 ソースは以下のようになっています。 <?php /** * The following code is a complete example of using phpcrawl with multi processes. * * Th