タグ

2009年9月19日のブックマーク (5件)

  • クローラーを作るためのフレームワーク·Anemone MOONGIFT

    RSSフィードやWeb API、Mashupなどの単語が注目を集める中、Webクローラーを通じて外部のWebサイトにあるデータをかき集め、それを解析して別な形にするというのはよく見られるものになってきた。 あるURLを指定し、そこからリンクされているURLを一覧表示できる そうした数々のシステムの中で、クローラーとなる基盤は大きな違いはない。Webサイトのデータを取得し、次のリンクを洗い出して取得していくようなものだ。そうした共通動作部分を切り出したフレームワークがAnemoneだ。 今回紹介するオープンソース・ソフトウェアはAnemone、Webクローラを開発するためのフレームワークだ。 Anemoneは任意のWebサイトにアクセスし、その内容を解析するWebクローラーだ。例えばあるURLに付けられているリンクを一覧で取得するようなことも簡単にできる。外部サイトなのかどうかも区別できるの

    クローラーを作るためのフレームワーク·Anemone MOONGIFT
  • Rubyでクローラー - BitArts Blog

    リンクだけじゃなく、フォーム、イメージ、フレームまでがっつり収集してくれるクローラーが欲しかったんだけどwgetではできないようなので自作することにした。 フォームのフィールドを集めたりするの、ちょっと大変そうだな。。と思ったんだけど、WWW::Mechanizeというライブラリを使ったら超簡単だった。ビバMechanize! require "rubygems" require "mechanize" class CrawlerListener def notify_begin end def pre_request end def notify_response(result) puts %Q{#{result[:method]} #{result[:uri]} #{result[:query] ? result[:query].inspect : ""}} end def post_

    Rubyでクローラー - BitArts Blog
  • jugyo.org

    This domain may be for sale!

  • Flex + Railsによるタイムトラッキング·Pomodo on Rails MOONGIFT

    Pomodo on RailsRuby on Rails製のフリーウェア(ソースコードは公開されている)。FlashやFlexは技術的には興味深いのだが、どうも二の足を踏んでしまっている。ユーザインタフェースをFlashベースで提供できれば、きっとこれまで以上にリッチな機能を提供できるに違いない。 Rails + Flexの参考に Railsを使えばFlexとの連携もそれほど難しくはないのかも知れない。そう思わせてくれたのがPomodo on RailsというWebアプリケーションだ。ユーザ向けにはFlex、システムはRuby on Railsで構築されたタイムトラッキングアプリケーションだ。 Pomodo on Railsプロジェクトやタスクを選択して時間を計測することでどれくらいのコスト、時間が費やされているかを知ることができるソフトウェアだ。Flexを使っているので画面がリッチで

    Flex + Railsによるタイムトラッキング·Pomodo on Rails MOONGIFT
  • チケット単位に並行開発する事例 - プログラマの思索

    分散バージョン管理Git、Mercurialを絡めたチケット駆動開発で、興味深い事例があったのでメモ。 【事例1】 gitだからこそできるチケット駆動開発のやり方 - kunitの日記 今やっている方法は、作業するなら作業用のブランチを切れ!それにはチケット番号を付けろ!という方式にしている。 たとえば会員管理の機能に追加したい場合は以下のような手順になる。 1. 会員管理を拡張したいなぁ 2. じゃRedmineでチケットを切るぞ 3. チケット番号が振られた(たとえば #567 だとする) 4. さぁ、ブランチ切るか(members_567) 5. そのブランチで作業開始! 濱野さんがWEB+DBでも入門Gitでもかかれている「トピックブランチ」というものの良さが当に現れてくる。 【事例2】 Mercurialを使った俺々バージョン管理ノウハウまとめ(2009年夏編) - 文殊堂 t

    チケット単位に並行開発する事例 - プログラマの思索
    tyabe
    tyabe 2009/09/19