タグ

2009年3月13日のブックマーク (1件)

  • Gungho::Manual::Tutorial.ja

    NAME Gungho::Manual::Tutorial.ja - Gunghoチュートリアル 初めてのGungho クローラーというものは実際に様々な因子が関係するので簡単なクローラーを作る、 というのはなかなか難しいのですが、ここでは以下の環境があると仮定して Gunghoでクローラーを実装するまでを追って行きたいと思います。 なお、ただ単純にリスト等からページを取得するだけであればexamples/ ディレクトリ 内のsimple等の例をお手とすれば良いでしょう。こちらではもう少し手間は かかりますが、実際にクローラーを作成する時に近い形での例を示します。 まずこれから取得したいURLのデータベースが存在すると仮定します。今回のクローラー では、このデータベースに存在する全てのURLを一回ずつ取得し、その結果得られる HTMLページからリンクを抜き出し、それを元のテーブルに追加す

    Gungho::Manual::Tutorial.ja
    hagihala
    hagihala 2009/03/13
    簡単な使い方