2006年12月24日 《PHP4》XML_HTMLSaxでHTMLをパースする[前] APIの公開(WEBサービス)って、すっかり流行ですね。 YahooやAmazonやGoogleの検索APIをはじめとして、価格.com や、価格.com傘下のフォートラベルもAPI公開をしました。後に続くサイトが増えてきています。利用する側としては、リソースが増えるのは良いことです。WEBサービスを複合化して、独自のサービスを提供する手法を”マッシュアップ”といいますが、リソースが増えればマッシュアップもいっそう活発になるでしょう。 さて、ネットワークプログラミングの基本はhttpのリクエスト送受信と、受け取ったHTMLやXMLをパースするところです。今回は、PHP4でHTMLを解析して、titleとmetaのdescription,keywordsを取り出してみます。 HTMLをパースする方法はいろ