以前のエントリで、RubyのNokogiriライブラリを使ったスクレイピングのやり方を紹介しました。 RubyのNokogiriを使ってサイトをスクレイピングする しかし、前回の方法では$ ruby scrape.rb http://eiga.com/movie/55975/ という様に一つひとつURLを指定しなければならず不便です。 そこで今回は前回のコードを拡張し、スクレイピングの自動化に挑戦します。 考え方 「自動化」というと難しい気がしますが、スクレイピングするURL(http://eiga.com/movie/55975/)の内、映画のidにあたる55975の部分を順に変化させていくことを今回のゴールとします。 ステップとしては2つで、 前回のコードを拡張し、存在しないURLへのアクセス時のエラー対応を実装 1のコードを別スクリプトから呼び出す という流れになるかと思います。 1
![サイトのスクレイピングを自動化する - Think Big Act Local](https://cdn-ak-scissors.b.st-hatena.com/image/square/a1a2943e876ec652ef34f41f71d1ba3cfd0f8fd2/height=288;version=1;width=512/http%3A%2F%2Fecx.images-amazon.com%2Fimages%2FI%2F41t7GQ3peRL.jpg)