[B! XPath] ryskosnのブックマーク

ryskosn id:ryskosn

XPathに関するryskosnのブックマーク (4)

GitHub - hieuvp/xpath-html: Easily use XPath to locate any element in an HTML DOM page.
ryskosn 2021/12/15
Node.js

XPath

JavaScript
リンク
Gentleちゃれんじ Tips -関数を利用したXPath式-
関数を利用したXPath式「XPath」は、既に昔の正規表現によるHTMLからの情報抽出を形骸化させるほどに流行っています。ネット上にも、XPathを紹介しているページが沢山ありますが、ここでは、普段あまりネット上で見ないXPathの関数を使って、より強力なXPath式を紹介したいと思います。レファレンステキストノードではなくテキストを取り出す perlでいうtrを、XPathで使うテキストを X 文字以上含む要素の取り出す特定の拡張子を持つリンクのみを取り出すまとめテキストノードではなくテキストを取り出す使用する関数の紹介 Function: string string(object?) (example) string(id('hoge')) = id が hoge の要素内のテキストを返す案外知られてないですが、要素内にあるテキストをそのまま文字列の形で取り
ryskosn 2011/07/28
XPath
リンク
無効なURLです
無効なURLです。プログラム設定の反映待ちである可能性があります。しばらく時間をおいて再度アクセスをお試しください。
ryskosn 2010/03/24
*webservice

*tool

XPath
リンク
Webスクレイプ時におけるXPath取得方について - うせーのブログ運営ひとりごと
勉強がてらamazonのベストセラーを引っ張ってきて、ジャンルごとに商品のランキング商品説明商品レビュー（参考になった上位3人）を並べてHTML形式に成形する、ということをやってみた。「引っ張ってきて」の部分はperlのWeb::Scraperモジュールを利用するのだが、スクレイピングするためには「ページのどの部分を拾ってくるか」を定義してやる必要がある。 use Web::Scraper;　今日のCPANモジュール今回は、XPathを指定してスクレイピングすることにした。XPathの指定は上記リンクの通り、Firebugを利用してみた。さて、このFirebugでのXPath抽出だが、amazonで試すと相当「ウソ」が返ってくることがわかった。上記の要素を拾ってきたいとする。Firebugが返す値は /html/body/div[4]/table/tr/td[2]/div/
ryskosn 2010/02/21
XPath
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx