タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

rubyとWebscrapingに関するartztのブックマーク (1)

  • スパイダリング(Spidering)の基礎

    スパイダリング(Spidering)の基礎 宮崎 真, 廣安 知之, 三木 光範 ISDL Report  No. 20050813008 2005年 9月 19日 Abstract スパイダ(spider)とは,インターネットから様々な情報を自動的に取得するプログラム のことである.スパイダを用いることによって,例えば複数のサイトにまたがって存在する情報を 組み合わせて,データ蓄積やファイル保存,独自の検索システムを構築,など様々なサービス が可能となる. 報告では,このスパイダリングについての概要および注意点を述べる. 1  はじめに 現在,Webサイトの肥沃化が進んでおり,実に30億以上ものページがWeb上に存在している. 多くの情報がオンライン化され,Webは従来に比べずっと閲覧しやすく,検索しやすく, 便利になったのである.しかしながら,この巨大なWebに対し,Webユ

  • 1