ブックマーク / qiita.com/checkpoint (1)

  • Scrapy入門(1) - Qiita

    Spiderの作成 次にコンポーネントの一つであるSpiderを作成します。 Spiderにはクロールの処理を開始するためのURLのエンドポイントと、 URLの抽出するための処理を記述します。 # -*- coding: utf-8 -*- import scrapy class QiitaSpider(scrapy.Spider): name = 'qiita_spider' # エンドポイント(クローリングを開始するURLを記載する) start_urls = ['http://qiita.com/advent-calendar/2015/categories/programming_languages'] custom_settings = { "DOWNLOAD_DELAY": 1, } # URLの抽出処理を記載 def parse(self, response): for hr

    Scrapy入門(1) - Qiita
    tks23
    tks23 2016/11/12
  • 1