nokogiri.rubyforge.org/ github.com/tenderlove/nokogiri/wikis github.com/tenderlove/nokogiri/tree/master rubyforge.org/mailman/listinfo/nokogiri-talk nokogiri.lighthouseapp.com/projects/19607-nokogiri/overview DESCRIPTION: Nokogiri (鋸) is an ... 続きを読む
■ [ruby] RubyでHTMLとWebを操作するためのライブラリ、HpricotとWWW::Mechanize 今日は、RubyでWebサイトを解析するときに強い味方となるライブラリ、HpricotとWWW::Mechanizeを紹介します。 どちらも非常に強力なので、覚えておいて損はないよ! 以下ではま... 続きを読む
phpNico - Trac phpNicoは、PHPを用いてニコニコ動画の情報を取得(スクレイピング)するライブラリです ニコニコ動画スクレイピング用ライブラリ「phpNico」が公開されています。 tracをベースにsvnで配布されている模様。 ランキングを取得したり出来るみたいで... 続きを読む
PHPでのスクレイピングに役立つライブラリ - (DxD)∞ APIが提供されていないサービスから欲しい情報だけを取得するには、HTMLなどから自前でスクレイピングを行うしかありません。PHPでのスクレイピングに役立つライブラリなどをまとめてみました。PHPでのスク... 続きを読む
ページから必要な部分だけをXPath式で抽出するPHP製汎用スクレイピングライブラリを作った要約:ページから必要な部分だけをXPath式で抽出するPHP製汎用スクレイピングライブラリを作ったいままでスクレイピングを使ったサービス(レシピ検索、書籍在庫一括検索... 続きを読む
via. PHPでTwitterのBotを作ってみる - yuyarinの日記取得したHTMLから目的の情報だけを取り出す。取り出したい情報はステータス番号 ($status_number)ユーザ名 ($username)メッセージ ($word)@先 ($at)の4つ。うまいやり方が分からなかったので、strpos()とs... 続きを読む