タグ

2010年2月5日のブックマーク (2件)

  • 最速インターフェース研究会 :: HTMLドキュメントを解析して特徴的なループを見つけるBookmarklet

    - 全てのDOMノードを列挙する - ノードは次のように文字列化される。 0: /html[0]/body[0]/div 1: /html[0]/body[0]/div[0]/div 2: /html[0]/body[0]/div[0]/div[0]/ul[0]/li 3: /html[0]/body[0]/div[0]/div[0]/ul[0]/li 4: /html[0]/body[0]/div[0]/div[0]/ul[0]/li 5: /html[0]/body[0]/div[0]/div[0]/ul[0]/li 直前の階層までは添え字つき、最後のノードはタグ名のみにする。 class名、id名は排除する。各々のサイトのルールで記述されたruleよりも タグのネスト構造の方が変化に強いし機械的に抽出しやすいのではないか? 出現回数でソートする。li要素2-5はループであることが分か

  • Page2Feed API 全てのページをRSS化 リーダー購読可能に

    RSSが無いサイトを、フィードリーダーで購読したいと思った事はありませんか?Page2Feed APIとは RSSが存在しないページでもlivedoor Readerなどで購読できるように、RSSを生成する実験的サービスです。 動作としては、HTMLから特徴的なループを見つけてフィードに変換します。 変更があった箇所が未読になるので新着が分かるのでlivedoor Readerで使用する前提のPage2Feedシステムです。 簡単に言うと「きれいなフィードではないけど、変更を検知するのに適したフィードを作ってくれる」 そんな機能です。 Page2Feed APIの使い方 以下のフォームにURLを入力し、livedoor ReaderなどのRSSリーダーで購読してください。 また、livedoor Readerのブックマークレットを使って登録可能なフィードが見つからなかった場合にも表示