PHP Simple HTML DOM Parser http://simplehtmldom.sourceforge.net/ HTMLをXML化してDOMやXPathで操作するWebスクレイピング用PHPクラス http://www.rcdtokyo.com/ucb/contents/i000851.php PHP で Google 第二回 サイト収集ツール(クローラ)と本文情報抽出を PHP で実装 http://d.hatena.ne.jp/h0x10/20090620/1245485703 PHPでのスクレイピングに役立つライブラリ http://dxd8.com/archives/85/ →HTMLScraping HTMLをXML化してDOMやXPathで操作できるクラス。 主にHTTP_Request+HTMLParser(XML_HTMLSax3を含む)/Tidy+Cac