TaKUMAのブックマーク - はてなブックマーク

TaKUMA id:TaKUMA

ブックマーク / momijiame.tumblr.com (1)

Python: Scrapy と BeautifulSoup4 を使った快適 Web スクレイピング
前回 BeautifulSoup4 を単独で使ってスクレイピングする方法について記事を書いた。 Web スクレイピングは主にクローリングとスクレイピングの二つのパートに分かれていて、BeautifulSoup4 は後者に特化したパッケージだった。今回は、Scrapy というフレームワークを使って、前者のクローリングも含めてやってみよう。まずは今回使用する Scrapy と BeautifulSoup4 をインストールする。ちなみに Scrapy は現時点で Python 3 対応が完了していないので、ここからの作業は全て Python 2.x 系の環境が必要になる。また、今回の内容には不要だけど、いちいち出る警告を消したいので service_identity も一緒にインストールしておく。 $ pip install scrapy beautifulsoup4 service_i
TaKUMA 2016/01/18
scrapy

Tips
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx