タグ

2007年9月3日のブックマーク (3件)

  • kakoueda.com, artist

    This is the homepage of the artist Kako Ueda. Her hand cut paper pieces deal with the notion of nature/culture--how organic beings (insects, animals, human bodies) are made from nature but constantly influenced and affected by culture. cut paper, body as environment, ecosystem, new york contemporary artist, Smack Mellon, george adams gallery, paper cut, cut out, cut paper, organic, insects, enviro

    CAMUS
    CAMUS 2007/09/03
    これは美しい。
  • Firebug で XPath を簡単に試す方法 - IT戦記

    適当に XPath を試したい時に 以下のようにすれば、簡単に XPath をためせます。 document.evaluate( '//div[@class="hoge"]', // XPath 式 document, // 基準となるノード(要素とか null, // 名前空間の解決方法(適当にやるときは null 6, // 取得する形式の指定(適当にやるときは 6 null // 結果を再利用するかどうか(適当にやるときは null ); 簡単ですね。 document.evaluate、式、ドキュメント、ヌル、6、ヌル。 覚えましたか? でも、これを Firebug で実行するとこうなっちゃいます。 うーん。これではどの要素が選択されたかわかりません>< 不便ですねー。 というわけで、以下のブックマークレットを実行してあげてください。 javascript:void(XPathRe

    Firebug で XPath を簡単に試す方法 - IT戦記
    CAMUS
    CAMUS 2007/09/03
    書いているうちにたまに軸がわからんくなるから、確認用にいいかもしれん(ホントはFireBugsにXPathもしっかり看てくれるXSLのデバッガもかねてほしいけどそれは我慢…)
  • Webstemmer(クローラーツール)

    語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ

    CAMUS
    CAMUS 2007/09/03
    本文抽出/タイトル抽出