タグ

2008年7月13日のブックマーク (3件)

  • CSSセレクタとXPathの判別 - ロックスターになりたい

    Web::Scraperのjavascriptバージョンwebscraper.jsのとおりどっちとしてもvalidになるものがあるので、書くひとがどっちなのかを明示できるのが合理的だと思う。 そのうえでCSSセレクタを観察するとXPathでよく使われる / がセレクタの中で存在し得るのは E[foo="value"] のときだけなので / があるかどうかで判別すると簡潔に処理できる。 / がなくてXPathCSSか誤判別する可能性があるとき、例として a という式の時にCSSだとコンテキストの子孫のa全部にマッチするけどXPathだとコンテキストの直接の子だけがマッチする。このときXPathであることを明示したければ ./ が自分自身をさすことを利用して ./a と書くことができる。つまり、どんなXPathも同じ意味のまま / を含んでいる形式で書き直すことができるので / の有無でCS

    CSSセレクタとXPathの判別 - ロックスターになりたい
  • Web::Scraperのjavascriptバージョンwebscraper.js - bits and bytes

    perlのWeb::Scraperみたいな記述で、ページの中からデータを取り出すwebscraper.jsという小さなjavascriptのライブラリを書きました。 ブックマークレット データを取り出したいページでブックマークレットでwebscraper.jsを読み込んでFirebugコンソールで使います。 ブックマークレット webscraper コードwebscraper.js つかいかた Web::ScraperのSYNOPSISで例としてあげられているebayでapple ipod nanoを検索した結果からデータを取り出すときは 検索結果ページで上のブックマークレットを呼び出してFirebugコンソールで取り出す部分を記述します。 こんなかんじ。 SYNOPSISのperlのコードで変数$ebay_auctionに一度代入されている部分をそのままインラインで書き直すと my $e

  • ネイティブXMLストレージ EsTerra XML Storage Server -メディアフュージョン

    インデックス周辺の改善による検索パフォーマンスの向上 インデックスアルゴリズムの改良により、検索に関する処理全体を高速化しました。 また、検索時のバッファマネージメントを見直し最適化することで、キャッシュ優先順位および乗せ換えタイミングをリファインしました。これにより、格納データ件数が増加した場合でも、よりフラットなパフォーマンス特性に改良されました。 Pre-Read Cache機能による初期検索パフォーマンスの向上 あらかじめ検索対象ドキュメントのアクセス頻度の高い部分を指定することにより、初期検索の速度を向上させることができます。キャッシュに存在させておきたい部分が指定されると、その部分の検索に関わるブロックはリポジトリのオープン時に専用キャッシュへ読み込まれます。 ロック機構の改善によるパフォーマンスの向上 EsTerra XML Storage Server V.