タグ

ブックマーク / zenn.dev/arao99 (1)

  • RubyでWebスクレイピング #3 Nokogiriを使いこなす

    前 #2 初めてのNokogiri 次 #4 URLの取得とページ遷移 準備 一応続きものなので、前回と同様の準備(Nokogiriのインストール)をしておけばとりあえず大丈夫。このシリーズ用のリポジトリも、今回の記事に合わせて更新済みだ。 GitHub zenn_scraping XPath vs CSSセレクタ Nokogiriで要素を指定する際、大きく分けてXPathによる指定とCSSセレクタによる指定の2パターンが考えられる。もちろんこれは対象や目的によって使い分けてもいいのだが、Webスクレイピング目的であればCSSセレクタの使用を推奨する。理由は3つあり、「WebエンジニアにとってCSSセレクタの方が馴染みがある」、「今時のWebページはidやclassが適切に使われていることが多いため、それを素直に利用できた方が良い」、「私がCSSセレクタの方しか使ったことがない(それでもW

    RubyでWebスクレイピング #3 Nokogiriを使いこなす
  • 1