[B! DOM][html] maeda_toriのブックマーク

maeda_tori id:maeda_tori

DOMとhtmlに関するmaeda_toriのブックマーク (6)

PHP Simple HTML DOM Parserでウェブのコンテンツを取り出す | 石間謙勝手ブログ Ver.2.5
- 1 user
- jbar.jp
- 暮らし
maeda_tori 2014/03/14
cURL

html

GET

DOM

URL

php

Simple HTML DOM Parser
リンク
PHP - failed to open stream: no such host is known
maeda_tori 2014/03/14
html

Simple HTML Dom

DOM

php

プログラミング

*あとで読む
リンク
PHP Simple HTML DOM ParseでUA偽装をする | zaru blog
PHPでHTMLをパースするで紹介したPHP Simple HTML DOM Parseで、UserAgentを偽装したくなったので、ちょこっとスクリプトを修正してみました。 simple_html_dom.php function file_get_html() { $dom = new simple_html_dom; $args = func_get_args(); $context = stream_context_create(array('http' => array( 'method' => 'GET', 'header' => 'User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET
maeda_tori 2014/03/13
DOM

html

parse

php

Simple HTML Dom

Simple HTML DOM Parser
リンク
PHP "Simple HTML DOM Parser"の使い方メモ - Stargazing && Temporary Escapism ~インプット馬鹿への道~
概要卒研のためにWEBサイトから必要な情報だけ抽出したデータセットを作成したときに用いた、PHPでHTMLを簡単にパースできるというPHP Simple HTML DOM Parserの使い方の備忘記録。参考ページ PHPでHTMLをパースする抽出対称 amazonのベストセラーのランキングページ2009年の本のベストセラーから ISBN-10 本のタイトル著者を取得する。 ※ 2010/12/29 時点でのhtmlには対応している。本のタイトル・著者抽出スクリプト <?php // ランキングページの1ページ目のURL(1位~20位) $page_url = "http://www.amazon.co.jp/gp/bestsellers/2009/books/ref=pd_ts_pg_1?ie=UTF8&pg=1"; // ランキングページのHTMLを取得 $page_da
maeda_tori 2013/09/29
html

DOM

*PHP

スクレイピング

Simple HTML DOM Parser

php

プログラミング
リンク
PHP Simple HTML DOM Parserがとっても便利
HTMLをパースしてきてDB化したり、RSSのテンプレに落とし込む…と言ったことを少し前からしているのですけど、1つ2つならいざ知らず対象サイトが増えてくると正規表現で何かし続けるのはたいそう無理があります。そういうわけでDOMを使ったりXPathを使ったりもしていたのですが、どちらもHTMLの構造にぴったりとは言えなくて、高度なことが出来るが故に記述が複雑になってしまうのでした。うーん。慣れるまでにハードルがあるな… そんなことを思っていたのですが、ふとした拍子に見つけたライブラリ「PHP Simple HTML DOM Parser」を利用してみたらば、とてつもなく便利でびっくり。jQueryのようなセレクタでガンガン指定して持ってくるスタイルでわかりやすいのなんの。 $text = $dom->find('#todays_darling', 0)->innertext; //今日のダ
maeda_tori 2013/09/27
html

DOM

php

parse

スクレイピング

Simple HTML DOM Parser

Simple HTML Dom
リンク
誰でもスクレイピング！DOM要素を引っこ抜くSimple HTML Dom
WEBサイトは著作権で守られています。許可無く勝手に人様のサイトから情報だけ抜き出して自分のサイト上に公開することは出来ません。この著作権の問題には十分注意してください。スクレイピング便利クラス　Simple HTML Dom スクレイピングの方法はいくつか存在するのがですが、私はSimple HTML Domを好んで使っています。色々調べた結果、個人的にはこれが一番使い易いと思いました。サイトからダウンロードし、simplehtmldom_1_5フォルダをスクレイピングを実行したいサーバーにアップして、simple_html_dom.phpを呼び出すだけで準備は完了します。引っこ抜きの指定が実はCSSそっくり！だからWEBデザイナーにも！簡単ですが、データの引っこ抜き方です。『ここを引っこ抜きたい！』という部分を指定します。下記の赤字部分に注目。引っこ抜きたい(スクレイピングし
maeda_tori 2013/09/26
スクレイピング

html

web制作

php

Simple HTML Dom

DOM
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx