PythonのWebクローリングとスクレイピングのフレームワークであるScrapyの使い方をサンプルコードとともに説明する。 Scrapy | A Fast and Powerful Scraping and Web Crawling Framework 以下の内容について説明する。具体例はYahoo! Japanを対象としている。 クローリングとスクレイピング ScrapyとBeautifulSoupの違い Scrapyのインストール Scrapyの基本的な使い方 単独のページをスクレイピングする例 リンクを指定してクローリング、スクレイピングする例 リンクを抽出してクローリング、スクレイピングする例 リンクを抽出して再帰的にクローリング、スクレイピングする例 Scrapyのバージョンは1.5.0。バージョン1.1からPython3にも対応している。 レポジトリは以下。 nkmk/scr