IDEA*IDEAさんで紹介されてました、HTMLの要素をSQLのように取り出せるPHPのライブラリ、htmlSQL。これは素敵なスクレイピングライブラリです。ちょっと使ってみましたが、なかなか面白く、使いやすいものになっていると思います。 SQLのようにというのは、sampleを紐解くと、 SELECT * FROM h1 SELECT * FROM a SELECT * FROM td SELECT href as url, text FROM a SELECT * FROM a WHERE preg_match(“/^http:\/\//”, $href) SELECT * FROM a WHERE preg_match(“/^\/snippets/i”, $href) and preg_match(“/^array_/i”, $text) SELECT * FROM * SELEC