masuidriveのブックマーク / 2009年1月5日

masuidrive id:masuidrive

2009年1月5日のブックマーク (4件)

WWWからの情報抽出
１．はじめに１・１　WWWと情報抽出 HTMLやXMLなどの半構造化文書から有用な知識を発見、抽出するためのWebマイニングの研究が注目を集めている。そしてWebマイニングの研究のひとつとして、Webページのコンテンツと構造を再構成し、新たな情報としてユーザに提供するための研究が行われている。これらの情報の再構成の鍵となる技術が、Webページから特定の箇所を自動的に抽出するための情報抽出である。１・２　Webラッパー Webページからある特定の部分を抽出するためのぷろぐらむや、抽出するための場所を指示する文法はWebラッパーと呼ばれる。ラッパーで抽出した情報は関係データベースのレコードやXMLデータなど必要な形式に変換され、新たなサービスを提供するために用いられる。１・３　Webラッパーの自動生成 Webラッパーが抽出の対象とするものはフィールド（例えば新聞記事といった限られたジャン
masuidrive 2009/01/05
ラッパー
リンク
Introduction to Range
This page gives an introduction to the Range objects. Using these, you can select any part of an HTML document and do something with this information. The most common Range is a user selection. This page concentrates on getting the user selection and converting this selection to a W3C Range or Microsoft Text Range object, although we'll treat the programmatic creation of Range objects, too. What i
masuidrive 2009/01/05
javascript

range

selection
リンク
選択範囲のリンクを取得する: Days on the Moon
Web ページの選択範囲に含まれるリンクを取得する方法として、Piro さんによる DOM 2 Range の compareBoundaryPoints メソッドを使ったやり方があります。これはリンクを探すのに DOM Core の機能を使って文書ツリーをたどっていますが、今現在ノードを探すといわれて真っ先に思いつくのは XPath でしょう。そこで、XPath を使って選択範囲のリンクを取得する方法を考えてみました。もちろん、選択範囲を扱う以上 DOM 2 Range も利用します。基本的な考え方 Range オブジェクトの取得選択範囲の始点より前にあるリンクの数の取得選択範囲の終点より前にあるリンクの取得選択されているようには見えないリンクの除外まとめ基本的な考え方基本的なアイデアは、選択範囲の終点より前にあるリンクで、選択範囲の始点より前にはないものが求めるリンクとい
masuidrive 2009/01/05
javascript

range

selection
リンク
DISQUS | Turn Blog Comments into a Webwide Discussion with a Powerful Comment System
More publishers trust us to engage, grow, and understand their audiences than any other. Build your on-site community with Disqus.
masuidrive 2009/01/05
コメントサービス

あとで試してみる
リンク
- 2009年1月6日
- 2009年1月5日
- 2009年1月4日