何個か Web アプリを作ったけど、そういえば、まだスクレイピングをやったことがありませんでした。ふり返っても、サービス内で処理が完結するものや、外部 API を呼び出すものばかり。今考えている Web サービスを実装するには、どうやらスクレイピングが必要っぽいので、Python で練習してみました。 初めてのスクレイピングということなので、有名どころの BeautifulSoup を使ってみます。クックパッドのレシピ情報を抽出するサンプルを書いてみました。 # -*- coding:utf-8 -*- import urllib import BeautifulSoup # HTML を取得 html = urllib.urlopen("http://cookpad.com/recipe/1069312").read() # 解析用の BeautifulSoup オブジェクトを作成 so