札幌のフリーランサーまいむぞうのブログ。Android関連、コンピュータビジョン、IoT、ロボティクスあたりをやっています。 スクレイピングって、あれね。 HTMLなどから特定条件で文字を取得するやつね。 昔はなんらかの言語のHTTPライブラリと正規表現を使ってガリガリ書くのが多かったんだけど、最近はスクレイピング用のアプリケーションとか、専用ライブラリも出てきたんで、ちょっとまとめてみました。 条件は プログラムを書く必要があるならRubyにする プログラミングが必要ないなら、それが一番(データを取り出して終わり) 特定ワードで検索して、検索結果からデータ取り出しってのを繰り返す もちろん日本語を扱う で、候補に挙がったのは以下の4つでした。 ■web-harvest Javaアプリ。 プログラミングの必要が無い。その代わりにXMLで条件を指定する。 本家 MOONGIFTでの紹介記事