はじめに PHPではすっかり定番となった感がありますが、「Simple HTML DOM Parser」で スクレイピングを行ってみます。 「Simple HTML DOM Parser」は、HTMLを解析してDOM形式で取得できて、jQueryみたいな感覚で、気軽にデータを抽出出来ます。 今回は、URLのリストのファイルから、スクレイピングして、その結果をCSVファイルに出力するという一連の処理を行ってみます。 なお、くれぐれも悪用禁止です。 ※DOM形式(Document Object Model)について知らない人は、以下でイメージをささっと掴みましょう。 http://piyo-js.com/05/dom.html 使い方 大まかな処理のイメージは以下の様な感じです。 スクレイピングしたいURLが記載されているファイル(read_url.txt)を用意します。 //read_url