タグ

xpathに関するext3のブックマーク (7)

  • 十章第一回 XPathとは — JavaScript初級者から中級者になろう — uhyohyo.net

    十章第一回 XPathとはこのページの最終更新日:2018年6月2日 十章では、またDOMの話題に戻ってXPathを解説します。 XPathとは、木構造中のノードを指し示す表現のことです。ノードは1つでもいいし複数でも構いません。 具体的な例として、例えば「body要素中の最初のp要素」とか、「3番目のa要素」とかそういった指定が可能です。そういわれるとCSSのセレクタを思い浮かべるかもしれません。しかし、XPathCSSセレクタよりも数段強力な表現力をもちます。 JavaScriptのDOMにおいては、このあるノードを表す表現を条件として使うことで、対応するノードを絞り込んで処理することができます。 これは、例えば「要素名」という条件に限ればgetElementsByTagNameでできていました。また、getElementByIdも条件によりノードを絞り込んでいるといえるでしょう。

    十章第一回 XPathとは — JavaScript初級者から中級者になろう — uhyohyo.net
    ext3
    ext3 2014/09/23
    あてにならんなぁ。なんでこの手のやつは初心者向けに書いてないんだろ
  • use Web::Scraper; - 今日のCPANモジュール(跡地)

    宣伝と注意書き このサイトが元になったCPANモジュールガイドというを書きました。 書でもとりあげています。 このページでは解説していない内容として、scraper { }を入れ子にするやり方も扱いました。scraperコマンドについては書では割愛しました。 2007-12-29 use Web::Scraper; 年の瀬にさりげなく再開。 久しぶりということでネタはたくさんあるのですが、ぱっとすぐ思いつくおススメ Web::Scraper を紹介。これはその名のとおり、ウェブのスクレイピングHTML のある部分を抽出)用のモジュールです。半年くらい前に生まれた新しいモジュールでありながら、すでにこの分野でメジャー感がある miyagawa プロダクトです。 API が用意されているサイトの情報は普通に API で取ればよいですが、世の中そうばかりでもないわけで、HTML を文字列

    ext3
    ext3 2014/08/18
    なるほどわからん
  • Item - データベース: AutoPagerize - wedata

    Database: AutoPagerize このデータベースはAutoPagerizeというuserscriptから利用するためのものです。 AutoPagerizeではWebページのurl、次のリンクを指すXPath、ページ要素を指すXPathなどをこのデータベースで共有し、 様々なサイトでの自動ページ継ぎ足しを実現しています。 AutoPagerizeについての詳細は、こちらを参照してください。 http://userscripts.org/scripts/show/8551 Last Update: 2024-03-11T18:17:35+09:00 History Database Details Import Items Create New Item

  • Java 入門 | XPath

    これらのノードはDOMノードとは異なることに注意が必要です。 属性ノード(attribute node)は、各々が属する要素に対応する要素ノード(element node)を親とするが、当該要素ノードの子ではありません。属性ノードは、開始タグで明示的に指定された属性及び、デフォルト値を持つ明示的に指定されていない属性についてのみ、各々が属する要素を親ノードとして、ツリー構造中の属性ノードとなります。子要素にも意味が継承される属性の場合は、明示的に指定された親要素のみ、属性ノードが存在し、継承する子要素に明示的に指定されていなければ、当該属性のノードを持つことはありません。 名前空間ノード(namespace node)も、要素を親ノードとするが、その子ではありません。名前空間ノードは、要素ノードに対して、当該要素ノード及びその子孫のノードの名前空間毎に一個ずつ結び付けられます。 処理命令(

  • AutoPagerize Wiki: How to write SITEINFO (ja)

    SITEINFOの書き方入門 SITEINFOは次のページへのリンクがどれかを示すnextLinkと、ページの中の文部分を示すpageElementとでできています。 nextLinkは複数にマッチするXPathでも大丈夫です。複数の要素にマッチするときは、一番はじめにマッチしたものが使われます。よくページの上部と下部に同じナビゲーションが入っているページがありますが、そのときも片方だけの次のページへのリンクにマッチするようにXpathを書かなくてもAutoPagerizeがマッチしたものの中で一番はじめのものを使ってくれます。(実装はそうなってるけど仕様としてどうなのかは知らない) AutoPagerizeのSITEINFOと同様な仕組みはLDRizeやLDR Full Feedでも用いられているので、書けるようになると他のところでも役に立ちますよ。他にもまじめにXSLTでバリバリ使わ

    ext3
    ext3 2012/02/20
    意味不明。わかりづらいわ
  • AutoPagerize Wiki: About SITEINFO (ja)

    AutoPagerizeの基的な動作は下の2つで、これが繰り返し行われます。 ページから「次のページのURL」を取り出す。 次のページを読み込み、「継ぎ足しに必要な部分」だけを取り出し、継ぎ足しを行う。 AutoPagerizeが動作するには、「次のページのURL」と「継ぎ足しに必要な部分」がどの部分であるかが分る必要があります。これらWebページによって様々なので、なかなか自動で見つけることはできません。そのためAutoPagerizeでは、自動でみつけるのは諦めて、Webページに応じて必要な情報をあらかじめ用意するという方法をとっています。AutoPagerizeでは以下の情報を利用するWebページごとに用意しています。 「次のページのURL」を示すXPath式 「継ぎ足しに必要な部分」を示すXPath式 どのWebページ(URL)に対して利用するのかを示す正規表現 これらの情報をま

  • AutoPagerize Wiki: How to write SITEINFO (ja)

    SITEINFOの書き方入門 SITEINFOは次のページへのリンクがどれかを示すnextLinkと、ページの中の文部分を示すpageElementとでできています。 nextLinkは複数にマッチするXPathでも大丈夫です。複数の要素にマッチするときは、一番はじめにマッチしたものが使われます。よくページの上部と下部に同じナビゲーションが入っているページがありますが、そのときも片方だけの次のページへのリンクにマッチするようにXpathを書かなくてもAutoPagerizeがマッチしたものの中で一番はじめのものを使ってくれます。(実装はそうなってるけど仕様としてどうなのかは知らない) AutoPagerizeのSITEINFOと同様な仕組みはLDRizeやLDR Full Feedでも用いられているので、書けるようになると他のところでも役に立ちますよ。他にもまじめにXSLTでバリバリ使わ

    ext3
    ext3 2012/01/19
    役立つツールのほとんどがリンク切れだが?わけわかめ
  • 1