Diggin - Simplicity PHP Library 2006-2009 Diggin MusicRider.com Projects. "Diggin"とは? 概要 Diggin は主にsasezaki個人によるスパイダー向けライブラリーの総称です。 高品質を謳ったり、パワフルさを持ち合わせている訳ではありません。 多くのライブラリは、ニッチな用途のため万人向けではないでしょう。 インストール 一部Zend Framework(以下、ZF)やPHP拡張に依存しているものがあります。利用の際には、各コンポーネントの必要条件にもとづいて環境を用意してください。(参照:ZFのインストールガイド)。Digginのバージョン0.6ではZF1.6以上、0.7ではZF1.9以上が必要となります。 Diggin の SVN リポジトリの最先端の URL は http://diggin.goog
<?php use Diggin\Scraper\Scraper; $scraper = new Scraper; $scraper->process( '#postlist li', array('postlist[]' => (new Scraper) ->process('//div[@itemprop="articleBody"]', 'articleBody', 'html') ->process('//div[@class="name"]/a', 'author_page', '@href', function($uri) { return $uri->toString();}) ->process('//ul["favlist"]//p[@class="fav"]', 'fav', 'raw', function($v) {return (int) $v;}) ) ); $r
こんにちは、飯塚です。 ウェブ上にはたくさんのデータがあふれています。その中から「自分の欲しいデータだけ」を「自動」でかき集めることができたら素敵じゃないですか? そこで今回は UT Startup Gym の「ウェブから情報をあつめる」で取り上げた内容をもとに、たった10行(正確には 9 行)のコードでひたすら「アイドル水着画像」を集める方法を紹介します。言語は PHP です! まずは結果から はい、これが今日の目標です。 さっそくコード書く mac ユーザはさっそくプリインストールされているターミナル.app を起動して、 $ emacs crawler.phpと入力して Enter(もちろん他のエディタでも OK)。頑張って下のコード(青色のコメント部分は写さなくていいです)を写経してください。 <?php $url = "http://matome.naver.jp/odai/21
HTMLをパースしてきてDB化したり、RSSのテンプレに落とし込む…と言ったことを少し前からしているのですけど、1つ2つならいざ知らず対象サイトが増えてくると正規表現で何かし続けるのはたいそう無理があります。そういうわけでDOMを使ったりXPathを使ったりもしていたのですが、どちらもHTMLの構造にぴったりとは言えなくて、高度なことが出来るが故に記述が複雑になってしまうのでした。うーん。慣れるまでにハードルがあるな… そんなことを思っていたのですが、ふとした拍子に見つけたライブラリ「PHP Simple HTML DOM Parser」を利用してみたらば、とてつもなく便利でびっくり。jQueryのようなセレクタでガンガン指定して持ってくるスタイルでわかりやすいのなんの。 $text = $dom->find('#todays_darling', 0)->innertext; //今日のダ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く