XMLじゃなくて、HTMLを解析したい…。しかもPHPで。 XMLだと、simplexml_load_file()っていう便利な関数がPHP5からあるけれど、HTMLはタグを取り除くぐらいしかない…というわけで、探してみたらHTMLをパースするライブラリがあった。 その名もまんまな、PHP Simple HTML DOM Parser。 PHP Simple HTML DOM Parser 2011/02/21 追記 ユーザエージェントを偽装する方法を書きました。 使い方 include('simplehtmldom/simple_html_dom.php'); $html = <<<EOM <ul> <li>aaa</li> <li>bbb</li> <li>ccc</li> </ul> EOM; $data = str_get_html($html); foreach($data->f