昨日は Windows で Scrapy 1.1.2 をインストールするために必要な libxml2 のインストールについて解説しました。 blog.mudatobunka.org が、どうやら Windows ではクローリングを実行するときにもう一つ win32api というライブラリが必要になるようです。 win32api が無いと、クローリングの実行中にコケます...。 状況再現 ひとまず適当な Spider を書いて走らせてみましょう。 月並みですが CNN.co.jp の記事一覧ページ から記事タイトルと URL を抜き出す Spider を書きます。 example/spiders/test.py # -*- coding: utf-8 -*- import scrapy class TestSpider(scrapy.Spider): name = "test" allowe
