タグ

ブックマーク / labs.gmo.jp (2)

  • HTMLのドキュメントから繰り返し部分をみつける - bits and bytes

    RSSを生成していないページからRSSを生成するなんでもRSS 0.1bは、公開されているJSAI2005: なんでもRSS - HTML文書からのRSS自動生成によると、日付情報を目印にしてそのHTMLドキュメントの構造を推測して、各エントリ(item要素)のタイトルと文を単語の統計的に処理して決定し、フィードを生成していると書かれています。 ウェブ上にあるHTMLドキュメントは Ask.jp : "xml" Search results. のように、RSSitem要素に相当する部分に日付が含まれていないものもあります。 その中でも、大量のデータを複数のページにわけて表示しているHTMLドキュメントを対象に、ドキュメント中に含まれる繰り返し部分のXPathを生成するブログラムをjavascriptで作りました。 アプローチ 大量のデータを複数のページわけて表示しているドキュメントを

  • ソーシャルコンテンツ証券市場 meta-markets - bits and bytes

    MMJ » Blog Archive » Delicious Bookmark Stocks にあるグラフで META-MARKETS というサイトを知りました。 meta-marketsは、かんたんにいうとソーシャルサービスのアカウントやコンテンツなんかを証券としてあつかって、サイト内の仮想通貨を増やして楽しむものです。 あそびかた 現在private alphaでinvitationをもらわないと登録できない状態です。しかたがないので、作っているひとのブログ Meta-Markets Journal(Wall Street Journalのもじりなのでしょうか)や、ヘルプを読んだかんじ、自分がはじめにdel.icio.usにブックマークしたURLやfacebookのプロフィールをIPOして、それを売ったり買ったりして株の評価額と、meta-market上での通貨、キャッシュのburak

  • 1