CAMUSのブックマーク / 2007年9月3日 - はてなブックマーク

kakoueda.com, artist

This is the homepage of the artist Kako Ueda. Her hand cut paper pieces deal with the notion of nature/culture--how organic beings (insects, animals, human bodies) are made from nature but constantly influenced and affected by culture. cut paper, body as environment, ecosystem, new york contemporary artist, Smack Mellon, george adams gallery, paper cut, cut out, cut paper, organic, insects, enviro

CAMUS 2007/09/03

これは美しい。

art
image

リンク

Firebug で XPath を簡単に試す方法 - IT戦記

適当に XPath を試したい時に以下のようにすれば、簡単に XPath をためせます。 document.evaluate( '//div[@class="hoge"]', // XPath 式 document, // 基準となるノード（要素とか null, // 名前空間の解決方法（適当にやるときは null 6, // 取得する形式の指定（適当にやるときは 6 null // 結果を再利用するかどうか（適当にやるときは null ); 簡単ですね。 document.evaluate、式、ドキュメント、ヌル、６、ヌル。覚えましたか？でも、これを Firebug で実行するとこうなっちゃいます。うーん。これではどの要素が選択されたかわかりません＞＜不便ですねー。というわけで、以下のブックマークレットを実行してあげてください。 javascript:void(XPathRe

CAMUS 2007/09/03

書いているうちにたまに軸がわからんくなるから、確認用にいいかもしれん(ホントはFireBugsにXPathもしっかり看てくれるXSLのデバッガもかねてほしいけどそれは我慢…)

リンク

Webstemmer（クローラーツール）

日本語サイトでは、具体的な性能は測定していませんが、以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞日刊スポーツ信濃毎日新聞 livedoor ニュース使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。取得したページのレイアウトを学習する。別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから本文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。ひとたびサイトのレイアウトを学習してしまえば、あとはレイアウトが大きく変更さ

CAMUS 2007/09/03

本文抽出/タイトル抽出

リンク

はてなブックマーク

タグ

2007年9月3日のブックマーク (3件)

kakoueda.com, artist

Firebug で XPath を簡単に試す方法 - IT戦記

Webstemmer（クローラーツール）

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス