前のエントリ XvfbとFirefoxとImageMagickでWebページのサムネイルを自動生成する方法 - pomo123の日記 でWebページのサムネイルを自動的に取得できるようになったので、今度はサムネイルを作成するWebページのURLを自動的に漁ってくるなんちゃってクローラーを作ってみます。クローラーについてはまったくの素人なので、本当に作ってみただけになっております。 概要 出発点となるURLを与えてやると、そのページをダウンロードして、HTMLを解析してページに含まれるリンクを抽出します。抽出したリンクは取得すべきURLリストに追加します。次に、その取得すべきURLリストから1つURLを取り出して、以降はダウンロード、リンクの抽出、リストへの追加を繰り返します。このとき、ダウンロードしたURLをアウトプットとして出力します。 なお、ダウンロードを行う際に、”以前そのURLはダ