仕事でちょっと必要だったので、python で動く crawler(Web ページを集めまくるツール)を調べてみました。 まずは Python Cheese Shop で crawler をキーワードに検索。すると以下のものがヒットしました。 HarvestMan 1.4.6 final Multithreaded Offline Browser/Web Crawler Orchid 1.0 Generic Multi Threaded Web Crawler spider.py 0.5 Multithreaded crawling, reporting, and mirroring for Web and FTP webstemmer 0.6.0 A web crawler and HTML layout analyzer SpideyAgent 0.75 Each use