ottonoveのブックマーク - はてなブックマーク

Rubyによるクローラー開発技法 vol4 ~nokogiri~ - 1人でアプリを作れるように
前回はWebサイトをクロールするところまで書いたので、次は取得したページを解析して、必要な情報を抜き出します。必要な情報を抜き出すには、 nokogiriというライブラリを使えばいいみたいです。使い方は簡単で、 nokogiriライブラリを使えるようにする require 'nokogiri' anemoneで取ってきたpageのHTMLデータをnokogiriオブジェクトに変換する doc = Nokogiri::HTML.parse(page.body.toutf8) doc.xpathメソッドで欲しい情報を抜き出す rank = it em.xpath("//div[1]").text これだけです。これならすぐできると思い、さっそく本に書かれた内容を写して実行してみたんですが、実行結果が本に載っているものと違う・・・。どうやらamazonのWebサイトが少し変わったよう
ottonove 2016/11/21
スキルアップ

プログラミング

情報整理

あとで読む
リンク
クローラーカテゴリーの記事一覧 - 1人でアプリを作れるように
今回はクローラーが収集したデータをデータベースに保存していきたいと思います。データベースにはPostgreSQLを使っていきます。 PostgreSQLを使う理由は、 Herokuというサービスと連携するのに都合が良さそうだからです。 Herokuについては実際に使う時に…
ottonove 2016/02/03
あとで読む
リンク
1

はてなブックマーク

タグ

ブックマーク / tumiki.hatenablog.jp (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / tumiki.hatenablog.jp (2)

Rubyによるクローラー開発技法 vol4 ~nokogiri~ - 1人でアプリを作れるように

クローラー カテゴリーの記事一覧 - 1人でアプリを作れるように

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

クローラーカテゴリーの記事一覧 - 1人でアプリを作れるように