Scrapy入門(1) はじめに PythonでWebスクレイピングを行う場合には、様々なアプローチが存在します。この記事ではスクレイピング用のフレームワークであるScrapyを題材に取り上げ実際に簡単なサンプルを作成しながら、Scrapyについて学んでいきます。 Scrapyとは Scarpyとは速くて、ハイレベルなスクレイピングのフレームワークです。Webサイトのクロールと、スクレイピングに関する様々な機能を持っています。主要な機能はコンポーネントに分かれており、ユーザーは各コンポーネントに関連するクラスなどを作成して、プログラムを作っていきます。 http://doc.scrapy.org/en/1.0/topics/architecture.html より 主要なコンポーネントは次の通りです。 Scrapy Engine コンポーネント間のデータフローの制御を担当 特定のアクション