[B! *javascript][xpath] cyokodogのブックマーク

cyokodog id:cyokodog

*javascriptとxpathに関するcyokodogのブックマーク (5)

XPath に文字列を埋め込むときの注意 - IT戦記
よく、以下のように XPath に文字列を埋め込む事があります document.evaluate('//*[@class="' + text + '"]', document, null, 7, null); まあ、僕もよくこんなコード書くんですけど。でも、これって text が外部から来るものだったら、意図通りの動作をしないんですよねたとえば、以下のような例です。 var text = '"] | /hoge/fuga/piyo | .["'; document.evaluate('//*[@class="' + text + '"]', document, null, 7, null); というわけで任意の文字列を XPath の式に変換する JavaScript を書いてみた以下で試せます http://amachang.sakura.ne.jp/misc/xpath_es
cyokodog 2009/09/18
*javascript

xpath
リンク
WSH で HTML を XPath したいんじゃあああぁぁ - Wisteria::Diary
CompleteX で文脈依存のヘルプを表示するために、各種ライブラリ (たとえば田楽 DLL) のドキュメントを INI ファイル形式に変換したい。ただし、できるだけロバストな記述で*1。具体的には素の Windows + IE 環境で (不特定多数の一般ユーザーのマシンで*2 ) 必ずしも well-formed でない HTML 文書を対象として XPath を使って内容をスクレイピングしたいという、一見ありがちな要求。なんだけど……これが全く一筋縄では行かないどころか五筋縄以上かいくぐる羽目になりましたことよ。結論現在のところ Windows + IE だけでは不可能。サードパーティの XPath 実装を使えば可能。 0 筋縄: 方針の確認まず、対象が純粋な XML なら簡単にできることを確認。 var dom = WScript.CreateObject("MSXML
cyokodog 2009/09/01
*javascript

wsh

xpath

jscript

_favorite
リンク
HTML と XHTML で同じ XPath を使う: Days on the Moon
通常、XPath を書くときは //p のようにすることが多いと思いますが、これには名前空間の指定が含まれていないため、XHTML 文書 (MIME タイプが application/xhtml+xml で提供されている文書) では使えません。これに対するアプローチとしては、//h:p のようにあらかじめ XPath 式に名前空間の指定を含めておき、リゾルバによる名前空間接頭辞の解決時に HTML と XHTML とで処理を分けるというのが一般的でした。「XPathNSResolver のクロスブラウザとか」や「document.contentType == "application/xhtml+xml"なページでの$X」で扱っている方法です。とはいえ、いちいち名前空間接頭辞を指定するのは面倒くさいですし、同じ名前空間に対する接頭辞が人によって違うのも不便です。XPath 式の中で要素名
cyokodog 2009/04/10
*javascript

xpath
リンク
XPath で "//" を使う時は気をつけようという話 � のっち大好きの会分室
document.evaluate の第二引数に適切なノードを指定していても， XPath expression が "/" で始まるとルートノードから走査されるので，意図通りの結果が得られない可能性が高い．ありがちなのは AutoPagerize で 2 ページ目以降を処理しようとして XPath に "//" を使ってしまい，結局ページ内の全ノードを舐めてしまうとか．面倒でも "descendant::" もしくは "descendant-or-self::" を使用されたい．もしくは， getElementsByTagName で済む場合であればそちらを使えば意図通りの結果が得られるし，なにより速いはず．一応，実験 (要 javascript/)．IE では動作しない．
cyokodog 2008/06/27
*javascript

xpath
リンク
XPath - 枕を欹てて聴く
調べてみるとちょっと衝撃を受けたので書いておく。以下XPathによるFirebug上からの抽出速度。抽出対象はLDR Full Feedで本文として指定しているもの。速度計測法はid:os0xさんのjottit.comのLDRize用XPath - FFFF - 0xで使っているFirebug組み込み関数である$xによる抽出1000回の所要時間。調査目的は、前から疑問に思っていた、抽出対象がclassなど特定条件で一発で抽出できる場合（//div[@class="entry_body"]など）の以下3つの疑問点全体からclassなどで一発で抽出するのと、祖先ノードにidのある場合、それをid関数で抽出した後子要素を検索するのではどちらが速いのか。 //div[@id="ほにゃらら"]はマジで遅いのか。 //div[@class="ほにゃらら"]と//div[contains(con
cyokodog 2008/04/11
xpathのノード指定の違いによる速度計測。ネイティブ実装でid取得した後絞りこむのが良さそう。

*javascript

xpath
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx