susieqのブックマーク / 2007年5月26日

susieq id:susieq

2007年5月26日のブックマーク (5件)

簡易翻訳「Web 2.0的データ抽出：Ruby/RailsでのScreen Scraping Episode 1」 | JAM☆ぱん
一定期間更新がないため広告を表示しています
susieq 2007/05/26
scrubyt

ruby ライブラリ
リンク
[ruby] RubyでHTMLとWebを操作するためのライブラリ、HpricotとWWW::Mechanize - Greenbear Diary (2007-02-05)
■ [ruby] RubyでHTMLとWebを操作するためのライブラリ、HpricotとWWW::Mechanize 今日は、RubyでWebサイトを解析するときに強い味方となるライブラリ、HpricotとWWW::Mechanizeを紹介します。どちらも非常に強力なので、覚えておいて損はないよ！以下ではまずHpricotでHTMLを解析・編集する方法について解説します。次に、「はてなダイアリーの自動更新」を例にWWW::Mechanizeの使い方を解説します。 Hpricot HpricotはHTMLを解析するためのライブラリです。例えば「あるページのリンクだけを全部抜き出したい」と思ったとき、どうしますか？scrAPIを使う？でもscrAPIはやっぱりちょっと使いたいだけなのにパーザ(Scrape)用のクラスを定義するのが面倒なんだよね！ Hpricotなら、たったこれだけで
susieq 2007/05/26
hpricot

ruby ライブラリ

スクレイピング

mechanize
リンク
はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
はてなグループの終了日を2020年1月31日(金)に決定しました以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記はてなグループ日記のエクスポートデータは2020年2月28
susieq 2007/05/26
Rails scrAPI

scrAPI
リンク
ruby のスクレイピングツールキット scrAPI - 川o・-・）＜2nd life
http://blog.labnotes.org/category/scrapi/ ruby でスクレイピングして web の情報を取得するのには、今まで正規表現か xpath でやってたので、わりと面倒でした。で、ふと scrAPI というスクレイピングツールキットを知ったのですが、これがかなり便利そう。このツールキットを使うと、CSS3 なセレクタを記述することで、要素を取得することができます。たとえばとあるサイトのリンクを全部取得したければ、 require 'rubygems' require 'scrapi' require 'open-uri' require 'nkf' require 'pp' $KCODE = 'u' links = Scraper.define do process "a[href]", "urls[]"=>"@href" result :urls e
susieq 2007/05/26
Rails scrAPI

RoR

スクレイピング
リンク
Podcastでプログラマーに必要な英語をStudyしよう！
「Java News.jp（Javaに関する最新ニュース）」の安藤幸央氏が、CoolなプログラミングのためのノウハウやTIPS、筆者の経験などを「Rundown」（駆け足の要点説明）でお届けします。（編集部）いまの仕事に「英語」は無用！本当に？昨今では、コンピュータ関連の翻訳書や日本人著者の書籍も増え、大抵の分野であれば、日本語で最先端の技術的情報を取得できるようになりました。ただ、最新の技術情報や、ニッチな領域の奥深い情報の場合、どうしても最新の洋書や、論文、英文のWebページの情報などに頼っているプログラマ・エンジニアも多いことでしょう。また、海外で開催されるカンファレンスのQ＆Aや、BOF（birds of a feather）などのミーティングの場合、英語力が即、理解力や情報伝達力に反映してきます。自分は日本にいて、日本人相手に仕事をしているから「英語」なんて関係ないと思
susieq 2007/05/26
podcast

英語
リンク
- 2007年5月27日
- 2007年5月26日
- 2007年5月22日