phpとxmlに関するnshashのブックマーク (3)

  • PHP5、未整形HTMLをSimpleXMLへ変換 - goungoun技術系雑記帳

    PHP5でのスクレイピングについて調査してみた。 正規表現でやってもいいのだけど。 PHP5でやるのだからSimpleXMLでやってみたい。 となると、いかに未整形HTMLを整形済にしてSimpleXMLとするかが 課題となる。これについて調べてみた。 ↓これが答え。なるものを見つけました。 HTMLParser(PEARのXML_HTMLSax3使用)orTidyで整形してるそうです。 HTMLをXML化してDOMやXPathで操作するWebスクレイピングPHPクラス : Under Construction, Baby: # SimpleXML+HTMLParser or Tidy+HTTP_Request+Cache_Lite http://www.rcdtokyo.com/ucb/contents/i000851.php これで調査終了。というのも寂しいので。 もう少しお手軽にで

    nshash
    nshash 2007/12/23
    DomDocumentにまかせてXPathで処理するか、SimpleXMLで処理するかは悩みどころかな。
  • FTPサーバー内の情報をRSSで配信:phpspot開発日誌

    XML.com: RSS Feeds for FTP Servers The applications for RSS have extended far beyond a way to distribute news items. RSS is now used for everything from tracking packages to car dealer inventories. FTPサーバに接続し、ファイルの状態をRSSで配信するスクリプトを作成するためのチュートリアルの紹介。 (PHPでFTPエクステンションが入っているサーバ向け) こういった仕組みがあれば、anonymousなFTPサーバーにファイルが追加された場合に、RSSリーダーでその変更を検地することができ、複数人数で同じFTPサーバ内のファイルを操作している場合なんかには、通知用として、なかなか使えるのではない

    nshash
    nshash 2006/03/29
    なんでもXML化
  • サイドフィード、サーバーインストール型RSSリーダーのベータ版

    サイドフィード株式会社は1月25日、サーバーインストール型RSSリーダー「フレッシュリーダー」のベータ版を同社Webサイトにて公開した。 フレッシュリーダーは、サーバーにインストールし、PCのWebブラウザから利用するタイプのRSSリーダー。個々で購読リストを作成できるほか、リストを複数人で共有することもでき、グループ全員で同一ソースの最新情報を入手できる。インターネット上だけでなく、イントラネット内のRSSフィードを取得可能。 また、同社が提供する「My RSS.jp」のエンジンを搭載しており、8万件以上のRSSに対応していないサイトの最新情報を取得することもできる。 Web型RSSリーダーは、ポータルサイトなどが無償で提供しているが、同社はイントラネットで利用できるのに加え、グループで専有できるため常に快適に動作させることができるとしている。 サーバーの対応OSはWindows、Lin

    nshash
    nshash 2006/01/25
    ライセンス云々は正式版以降かな?なかなか良いです
  • 1