Hpricotは Ruby用の HTML パーサです。スキャン部分は C 言語で書かれていて高速に動作します。 HTMLの解析や書き換えに威力を発揮する便利なライブラリです。 rubygemsを使うのが簡単です。 # gem install hpricot すると以下のようにプラットフォームを聞いてきます。Unix系OSであれば 1 を、mswin32 であれば 2 を選びます。 Select which gem to install for your platform (i386-freebsd6) 1. hpricot 0.4 (ruby) 2. hpricot 0.4 (mswin32) 3. Cancel installation コンパイルが始まり、インストールが行われます。 Building native extensions. This could take a while.
■[Ruby] HTMLを解析してRailsのデータベースに格納 「バーチャルコンソール 現在配信中のタイトル(スーパーファミコン)」の内容を解析して、Railsのデータベースに格納するコードを書いてみた。以前に構築したCygwin環境で動いてます。 指摘とか突っ込みとかありましたら、お気軽にコメントへどうぞ~ ちなみに、HTMLパーサのHpricotライブラリの弄ってたら いつの間にかこんなものが出来上がっていたw ◎参考書籍 → ライド・オン・Rails Ruby on Railsを徹底攻略 RubyからRailsのデータベースにアクセスする方法。(p.236あたり) ◎参考サイト → RubyScraping - Hpricot → pylori*style wiki - HTMLパーサ Hpricot → Greenbear Diary - RubyでHTMLとWebを操作するため
■ [ruby] RubyでHTMLとWebを操作するためのライブラリ、HpricotとWWW::Mechanize 今日は、RubyでWebサイトを解析するときに強い味方となるライブラリ、HpricotとWWW::Mechanizeを紹介します。 どちらも非常に強力なので、覚えておいて損はないよ! 以下ではまずHpricotでHTMLを解析・編集する方法について解説します。 次に、「はてなダイアリーの自動更新」を例にWWW::Mechanizeの使い方を解説します。 Hpricot HpricotはHTMLを解析するためのライブラリです。 例えば「あるページのリンクだけを全部抜き出したい」と思ったとき、どうしますか?scrAPIを使う?でもscrAPIはやっぱり ちょっと使いたいだけなのにパーザ(Scrape)用のクラスを定義するのが面倒なんだよね! Hpricotなら、たったこれだけで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く