GreasemonkeyのスクリプトでAutoPagerizeというものがあります。これはgoogleの検索結果のように何ページにもページが別れているときに、次のページを表示するためのリンクを押さなくても自動的に次のページの中身がAjaxで継ぎ足されて表示されるというものです。 オモロ 検索エンジン SAGOOL サグール の検索結果のページがAutoPagerizeとおなじしくみになっていて、検索結果を一番下まで見ると自動でさらに10件が表示されるようになっているので試してみてください。 これが極めて快適で、慣れると次へのリンクを押す生活には戻れません。記事全体は長いのに1ページの文章量が少なくて、次のページへのリンクをやたら押さないといけないニュースサイトなどは当然のように対応されていて、クリックする必要がなくなって、ストレスなく文章に集中できるようになります。対応しているサイトも
ajaxslt(JavaScript による XSLT の実装)を用いて XPath 式を評価するサンプル・コードです。 サンプル・コード 以下にサンプル・コードを示します。lib ディレクトリに ajaxslt の JavaScript ファイルが置かれているとして記述しています。また、動作確認は ajaxslt 0.7、Firefox 1.5、Internet Explorer 6.0 で行いました: <html> <body> <script language="javascript" type="text/javascript" src="lib/util.js"></script> <script language="javascript" type="text/javascript" src="lib/xmltoken.js"></script> <script languag
以下のサイトからダウンロードしてお使いください。 Prototype.js 用 http://coderepos.org/share/wiki/JavaScript-XPath/bindings/Prototype jQuery 用 http://coderepos.org/share/wiki/JavaScript-XPath/bindings/jQuery 使いにくいところがあれば すぐになおしますので、コメントやブックマークなどで教えていただければ嬉しいです。 他のライブラリのプラグインに関して そのうち、開発したいなあとは思っているのですが。 そのライブラリの空気感(コンセプト)を読めないと、なかなか使いやすいプラグインは書けないので時間がかかりそうです。 もし 誰か書いてくれる人がいればとてもありがたいなあ。。。とか思っています。 いませんよねいませんよね><? 「こんな、感じで
id:amachang がリリースした JavaScript-XPath が、かなり良さげ。 JavaScript-XPath の検索結果を jQuery オブジェクトにして、利用できると便利そうなので、以下のようなコードを書いてみた。 (function(jQuery){ jQuery.xpath = function(selector, context){ context = context || jQuery(document); var r, res=[]; context.each(function() { r = document.evaluate(selector, this, null, 7, null); for(var node_no=0; node_no<r.snapshotLength; node_no++){ res.push(r.snapshotItem(nod
XPathの習作。あるページのパラグラフのループを見つけてXPath式で取得するための支援ツール。 http://ldride.googlecode.com/svn/trunk/readme.html ブックマークレットで起動してるので、IEでもSafari2でも動きます。XPath評価には id:amachangのこれつかってます。 ナビゲーションとしては、最初に親となるコンテナエレメントを指定して、その後パラグラフに相当する場所をクリックしてxpathを取得する感じ。 名前はAutoPagerize IDEにちなんで、LDRize IDEに。でもLDRizeはあまり使ったことなかったりして、どれほどほんとに使えるのか分かりませんが。今のところlinkのところは自分で書く必要あり。 ユーザ支援じゃなくて、自動化してる試みは結構あるみたいなんで、そっちの方もおもしろそう。 http://l
2007年10月29日22:16 カテゴリMozilla XPathを確認するのに便利なFirefox拡張機能 XPathで自分が意図したものを指定できているかどうかを確認する時に、Firefox拡張機能の XPath Checker を使うと便利です。 対象ページで右クリックして、コンテキストメニューから View XPath を選択すると、XPath Checker のウィンドウが表示されます。 XPath: に入力すれば対応するものが表示されます。 前の記事(PlaggerでNational Geographicの日替わり画像をGmailで見る)で、Filter-EntryFullText の yaml(通称EFT)を書いた時に初めて extract_xpath を使ってみました。 タイトルや画像、本文等を XPath 指定で取り込んでいます。 取り込むページのソースにもよりますが、
AutoPagerize用のXPathをかんたんに作るためのブックマークレット AutoPagerize IDE - bits and bytesみたいに、ブラウザ上でクリックした要素を表すXPathがほしいことがよくある。perlだったらこないだのXML::LibXML::ElementのnodePathでおしまい。 jsだとFirebugが中にそういうのを持ってる。コンソールに出力されたHTML要素の上にマウスを持っていくと、その要素を表すXPathが表示されるやつ。 extensionからだったらFirebugLib経由で呼び出すことができます。 /** * Gets an XPath for an element which describes its hierarchical location. */ this.getElementXPath = function(element
特定のエレメントからそのエレメントを表すXPathを生成することがよくある。perlだとこれが楽にできるのを XML::Diff — XML DOM-Tree based Diff & Patch Module - search.cpan.org のソースを見てて知った。 XML::LibXML::NodeにnodePathっていうメソッドがある。 This function is not specified for any DOM level: It returns a canonical structure based XPath for a given node. と書いてある通り use XML::LibXML; my $xml = <<'__XML__'; <root> <category> <name>fruit</name> <item> <name>apple</name>
JS の XPath なんて書きましたけど、重大なバグがありまして、っていうかなんで気がつかなかったんだろう、えーそれは application/xhtml+xml なページ、すなわち XML として、名前空間をちゃんと扱うページではまともにセレクトできないんですよーははははー、例えばこのサイトとかね。 $X = function (exp, context) { if (!context) context = document; var resolver = function (prefix) { var o = document.createNSResolver(context)(prefix); return o ? o : (document.contentType == "text/html") ? "" : "http://www.w3.org/1999/xhtml"; } v
XPath Checker 0.4.1 作者: Brian Slesinsky カテゴリ Web 開発 An interactive editor for XPath expressions. レビュー (3) 2006年 9月 27日 更新 834 週間ダウンロード数 57,776 累計ダウンロード数 他の画像 詳しい説明 An interactive editor for XPath expressions. Choose 'View XPath' in the context menu and it will show the editor. You can edit the XPath expression and it incrementally updates the results. ホームページ http://code.google.com/p/xpathchec
Greasemonkey - Mozilla Firefox まとめサイト で、Dive Into Greasemonkey の日本語訳 (PDF)が公開されてます。 これは凄く良い仕事。いやマジで。超感謝。 で、それの28頁以下で、Firefox に組み込まれた XPath のサポートの使い方が説明されてまして、これで /getElements?By.+/ 地獄からおさらば出来るわけですが、 XPath を解釈するのに使う document.evaluate は引数がたくさんあって、生で使うのは面倒いです。 でも使う引数はクエリ部分以外は普通は決まってるので、30頁以下で、XPathを楽に使うために以下の関数を定義すると良いよね、とあります。
Add-ons extend Firefox, letting you personalize your browsing experience. Take a look around and make Firefox your own.
Warning! 2008/5/22追記:このエントリは情報が不十分だったり間違いが含まれてたりするので、下記URLのページを参考にするようにしてください↓ http://piro.sakura.ne.jp/latest/blosxom/mozilla/xul/2007-09-13_selector-to-xpath.htm CSS3あたりをXPath1.0あたりに変換する表 CSSXPath .class//*[@class="class"]*1 .class//*[contains(concat(" ",@class," ")," class ")]*2 tag//tag #id//*[@id="id"] tag.class#id//tag[@class="class"][@id="id"] .class.class2//*[contains(concat(" ",@class," "
先日 PerlでCSSセレクタ で HTML::Selector::XPath がいい感じであると思ったわけですが、CSS セレクタだけじゃなく何気に HTML::TreeBuilder::XPath とのコンボがすげーイイ!ということにいまさら気づきました。 HTML::TreeBuilder::XPath で findnodes するとツリー状に連なった HTML::Element なデータ構造が返ってくるんですが、HTML::Element は API をかなりいろいろ持ってて、これをうまく使ってやるとスクレイピングを自然な感じで書けます。 例えばはてなダイアリーの任意のページから、本文部分だけをスクレイピングしたいと思ったときにキーワードリンクが邪魔だったりするわけですが、とりあえず HTML::Selector::XPath で div.section をぶっこ抜いて取れた HT
Tuesday, 08 Nov 2005 XPath Checker [Updated with source code for developers.] XPath Checker is a Firefox Extension I wrote for testing XPath expressions interactively. You might find it useful if you use xpaths or want to learn how. If you haven't used xpaths before, they are sort of like regular expressions for web pages. XPaths make it easy to extract content from deeply nested markup in a web p
Name Description CHANGES release changelog xpath2rss-0.2.tgz alpha xpath2rss-0.3.tgz alpha xpath2rss-0.5.tgz alpha xpath2rss-0.6.tgz alpha xpath2rss-0.7.tgz latest release xpath2rss 0.7 by Mark Nottingham <mnot@pobox.com> INTRODUCTION ------------ xpath2rss is Yet Another HTML->RSS scraper. This one's different in that instead of using regular expressions, as most do, it uses XPath. Why XPath? The
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く