スクレイピングに関するhimselfproのブックマーク (1)

  • お題目うぉっち:WatirでIEを自動操縦

    2008年03月09日 WatirでIEを自動操縦 Webページのスクレイピングには今まで Mechanize を使っていたのだが、IEを自動操縦する Watir はそれ以上に便利だと思った。 Watirのチートシート #! ruby -Ks require 'watir' ie = Watir::IE.new ie.goto('http://reader.livedoor.com/reader/') ←ページ遷移 ie.link(:text, /ガイド/).click ← リンク文言を正規表現で検索してクリック puts ie.text ← ソースを表示 コードを実行すると、自動的にIEが立ち上がって無人操作を開始する。 フォームに記入する場合についても、全般的に書き方がMechanizeよりわかりやすいと思う。何よりもIEが文字コードの自動判定をしてくれるので、リンクやフォーム部品を探

  • 1