何個か Web アプリを作ったけど、そういえば、まだスクレイピングをやったことがありませんでした。ふり返っても、サービス内で処理が完結するものや、外部 API を呼び出すものばかり。今考えている Web サービスを実装するには、どうやらスクレイピングが必要っぽいので、Python で練習してみました。 初めてのスクレイピングということなので、有名どころの BeautifulSoup を使ってみます。クックパッドのレシピ情報を抽出するサンプルを書いてみました。 # -*- coding:utf-8 -*- import urllib import BeautifulSoup # HTML を取得 html = urllib.urlopen("http://cookpad.com/recipe/1069312").read() # 解析用の BeautifulSoup オブジェクトを作成 so
![Python と BeautifulSoup でスクレイピング入門 - present](https://cdn-ak-scissors.b.st-hatena.com/image/square/4840bb52b52db051210e4450927f9371618da98e/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fg%2Fgriefworker%2F20110601%2F20110601220755.png)