この記事は最終更新日から一定の時間が経過しています。情報が古くなっている可能性があるため注意してください。 Webスクレイピングに関する記事は散々出尽くしていますが、2022年現在 Ruby で Webスクレイピングをしたい場合の技術選定ってどんな状況だろう?という疑問のもと調べ直したのでまとめたいと思います。 結論、特に新しいものではなく典型的な Mechanize および Nokogiri による構成に落ち着きました。 Nokogiri は直接操作するのが初めてだったので、使ってみた感想にも触れていきたいと思います。 この記事で説明すること Ruby での Webサイトスクレイピング手法の実装の一例を説明します。 ログインが必要なページでの Mechanize の実装例について そして記事の最後ではなぜ Ruby なのかを個人的な目線で説明します。 説明しないこと Ruby の環境構築
![RubyでWebスクレイピング 2022年(結局 Mechanize と Nokogiri)](https://cdn-ak-scissors.b.st-hatena.com/image/square/3f9f6e38285bdbe55d42e4d75ac414cc3d55f06b/height=288;version=1;width=512/https%3A%2F%2Fcdn.fand.jp%2Fimages%2F2022%2F02%2Fece2417e-eye-webscraping-with-ruby.png.webp%3F220212000000)