Xpathに関するpublichtmlのブックマーク (4)

  • ブログ本文を取り出しやすくするマイクロフォーマットについて(ちょっと)調べてみた | 秋元@サイボウズラボ・プログラマー・ブログ

    ほんとにちょっとなので期待しすぎないで。 XPathの不便なところ – ぶろぐ。@はてなで、特に意味はないけど(笑)XPath文を探しにくいサンプルとしてこのブログが上げられていた(すいませんほんとに)。 そのXPathは、LDRFullFeedで使うことを想定しているということ。見てみたら、WebページのURLから文を取るためのデータで、そこは参加者が持ち寄って作るデータベースらしい。 LDRがlivedoor Readerだとすると、このブログは全文出してるので文はそっから取れるのだけれど、このデータはそれに限らずいろいろな文を取り出すスクリプトで参照されるから、フィードから文が全部取れるかどうかはまた別の話なのかもしれない。 とにかく、スクリプトに優しくないということなので個別ページのHTMLのソースを見てみた。で、上のページもあわせて読むと、なんとなく不親切な構造なんだ

    publichtml
    publichtml 2009/02/16
    本文を抽出するためのあれこれ。
  • XPathGraph

    ただいま6月7日以降に新しく作成したグラフが更新されない不具合を確認しています。原因調査中ですが、マッシュアップ先のはてなグラフの影響の可能性もあり解決までしばらく掛かるかもしれません。ご不便をお掛けしまして申し訳ございません。作成済みのグラフに関しては問題なく更新されています。また登録についても(更新はされないものの)可能です。 XPathからグラフを生成。 XPathGraphはウェブサイト上にある数値を定期的に取得し、自動的にグラフを作成するサービスです。取得したい数値を含むノードをXPathで指定すると、その日に巡回した結果をグラフに追加していきます。[詳しく] 例えば こんなグラフを作成出来ます 為替 no description 2008年11月12日 18:28 怖い絵2Amazonランキング no description 2008年12月18日 20:09 microSDH

  • 【インフォシーク】Infoseek : 楽天が運営するポータルサイト

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

    publichtml
    publichtml 2008/03/14
    コンパクトで便利そう。XPathチートシート/XPath全関数一覧/Xpath for Javascriptの3枚。
  • てきとうにクリックしたらてきとうにWeb::Scraperのコードを作ってくれるWebScraper IDE - bits and bytes

    まえに作ったWeb::Scraperのjavascriptバージョンwebscraper.jsとXPathをてきとうに作ってくれる機能を追加したwebscraperp.jsにHTMLのドキュメントから繰り返し部分をみつけてSITEINFOをつくるAutoPagerize Iteration Detectorみたいなみためをくっつけて、取り出したい部分をクリックしたらてきとうにXPathを生成してWeb::Scraperのコードにして出してくれるFirefoxのextensionを作りました。Firefox3専用です。ごめんなさい。 ダウンロード WebScraper IDE (for Firefox3) 使い方 今回もいつもお世話になっているスターバックスさんの店舗検索結果(住所・店名・条件から探す)を例に使い方をご紹介します。 WebScraper IDEをインストールするとツールメニュ

    publichtml
    publichtml 2008/03/13
    クリックした所のXpath生成→Web::Scrapperのコード生成
  • 1