■ 1. まず php-xml のインストール yum install php-xml ■ 2. 実際のサイトからスクレイピングを行って Xpath で要素を取得のPHPコード test.server.com から WEBページを取得してきて<div id="myid">の要素を取得します。 $url='http://test.server.com'; // file_get_contents を使うより高速、ただしメモリは食う require_once 'HTTP/Client.php'; $client =& new HTTP_Client(); $client->get($url); $response = $client->currentResponse(); $dom = @DOMDocument::loadHTML( $response['body']); $xml = sim
Getting Started Introduction A simple tutorial Language Reference Basic syntax Types Variables Constants Expressions Operators Control Structures Functions Classes and Objects Namespaces Enumerations Errors Exceptions Fibers Generators Attributes References Explained Predefined Variables Predefined Exceptions Predefined Interfaces and Classes Predefined Attributes Context options and parameters Su
Getting Started Introduction A simple tutorial Language Reference Basic syntax Types Variables Constants Expressions Operators Control Structures Functions Classes and Objects Namespaces Enumerations Errors Exceptions Fibers Generators Attributes References Explained Predefined Variables Predefined Exceptions Predefined Interfaces and Classes Predefined Attributes Context options and parameters Su
ページ情報 制作日 2004-02-14 最終更新日 2004-02-14 参照用URI http://www.arielworks.net/articles/2004/0214a 分野 PHP XSLT関数に慣れていると名前空間の仕様に混乱するかもしれないので簡単な説明を書いておく。PHPのバージョンは4.3.4だ。 デフォルトの名前空間 まずはXHTML文章の名前空間を思い出す。 <?xml version="1.0" encoding="UTF-8"?> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>テストページ</title> </head> <body> <h1>見出し</h1> <p>本文</p> </body> </html> このXHTML文章(のようなXML文章)はxmlns="http://www.w
Don't let me cry(右手を回して拳のつきあげ) Don't let me sigh( 左手を回して拳のつきあげ)呪文のように唱えて(両手を頭の上でクラップジャンプ) SimpleXMLの使い方メモ。 CDATAなんてのはパースできないので諦める。 対象、自分のはてぶ <?php $xml = @simplexml_load_file('http://b.hatena.ne.jp/cockok/atomfeed'); すべてのタイトルを表示する foreach ($xml->entry as $entry) { var_dump($entry->title); } すべてのタイトルを表示する(XPath) $xml->registerXPathNamespace('atom', 'http://purl.org/atom/ns#'); foreach($xml->
I’ve recently switched my blog from b2evolution back to WordPress. The good news is both “no more spam :)” and “the admin panel works in Safari”, but on the downside I missed the multiblog feature that attracted me to b2evolution in the first place. There is WordPress MU, I suppose, but after coming across a few plugins that warned they didn’t work with WordPress MU, that option didn’t look very a
Twitter Facebook B! Bookmark LINE Pocket Feedly HTMLをスクレイピング(scraping)してあれこれとするとき、僕はずっと正規表現に頼っていたのですが、 ページの構造が変化するとすぐに使えなくなってしまうし、時間がかかる割りに退屈な作業なので何とかならないかなと思っていました。 PHPで探していたのですが、XML(とかRSS)をパースする関数やライブラリは、良く目にするものの、HTMLを処理できるものはなかなか見つかりませんでした。 以下は、PHP(とかRuby、Perl)でHTMLをスクレイピングしたりパースするための方法。 PHPでスクレイピング&パース HTMLを整形式のXML文書に修正するPHPクラス HTMLを、整形式のXMLに変換してくれるライブラリ。PEARのXML_HTMLSax3が同梱されているので、これだけでちゃんと動
mixiにrdfでweblogモジュールの内容を反映させようと、rdf生成プログラムの作成に取りかかる。 最初、wordpressモジュールのwp-rdf.phpを参考にしようと思ったら、includeしまくってて断念。そこで、pearを使おうと思った。 PEAR::XML_Serializerを見つけて、rdfは生成できるらしいのだが、なにしろドキュメントが皆無。β版なので公式ドキュメントもない。全く手が出ない状況だったのだが、PHP-users-MLで http://ns1.php.gr.jp/pipermail/php-users/2004-December/024339.html を読んで、とりあえずとっかかりができた。しかし、この投稿者は岩手情報大の学生のようだが、よくここまで書けたものだと感心した。どうも英語が達者ならしく、海外のPEAR-MLでも同様の質問をしていた。 おそら
Chiemi Akasaka g031z002 @ edu.soft.iwate-pu.ac.jp 2004年 12月 6日 (月) 20:20:53 JST 前の記事 [PHP-users 23809] Re: 正規表現で日本語にマッチさせるには 次の記事 [PHP-users 23821] Re: PHP PEAR::XML_Serializer でRSS1.0を生成する方法に関して 記事の並び順: [ 日付 ] [ スレッド ] [ 件名 ] [ 著者 ] 赤坂です。 PEARのXML_Serializerを使って、RSS1.0を生成するPHPコードを書いています。 パッケージのサンプルコードやその他の情報を参考にコードを書いたのですが、 正しいRSS1.0の構文にありつけません。 生成したいRSS1.0の構文は以下の通りです。(sample01) *****************
pear XML_RSSをportsからインストールする portsから pear-XML_RSSをインストールします。 % cd /usr/ports/devel/pear-XML_RSS/ % sudo make install clean ===> Installing for pear-XML_RSS-0.9.10 ===> pear-XML_RSS-0.9.10 depends on file: /usr/local/share/pear/PEAR.php - found ===> pear-XML_RSS-0.9.10 depends on file: /usr/local/share/pear/XML/Parser.php - found ===> pear-XML_RSS-0.9.10 depends on executable: pear - found ===> Gen
ここにある情報はかなり古くなっており、正しくなくなっている可能性があります。掲載しているサンプルコードiなどは、最新のPHPでは動作しない、もしくは、別途設定・調整が必要になるかも知れません。情報を鵜呑みにせず、あなたの手を動かして、あなたの目で確認してください。 [2004/08/12] PHP5.0.0ではphp.iniの設定を行っても「?」に化けてしまいます。とりあえず、RSS.phpの130行目あたりにある「$this->XML_Parser();」を「$this->XML_Parser('utf-8');」とすることで解決します。また、PHP5.0.1-devで修正されているようです。haltさん、情報ありがとうございました。 [2004/07/20] PHP4でマルチバイト文字が「?」に化ける場合、php.iniのmbstring.languageがJapaneseになってい
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く