クローラ開発してみようと思い、適当にググってみたんだけど情報少ない。 とりあえずJavaのNutchがメジャーなのかな?ってのは把握。 そもそもクローラとスパイダーっていう用語もどっちがメジャーなんだろ。 そんななか見つけたのが、Ruby のクローラフレームワークなるAnemone。 お手軽そうだったので、Anemone使ってはじめてのクローラ作ってみるよ。 ・インストール gem install anemone おわりー。 ・ スクレイプしてみる 今回のスクレイプ対象はiddy API。 まぁなんでもいいんだけどね。 ユーザのプロフィールURLをがさっと削りとってみる。 $KCODE = 'u' require 'rubygems' require 'anemone' #anemoneにメソッド追加 module Anemone class Page def doc4xml r