何度かBeautifulSoupについては書いているのですが、未だに使い方が覚えられずにイライラします。仕方が無いのでまとめて置く事にしました。BeautifulSoupはHTMLから情報を取得するだけ無く、HTMLの編集もできますが、ここではスクレイピング用途のみに絞ってい... 続きを読む
Beautiful Soup Documentation by Leonard Richardson (leonardr@segfault.org) Beautiful Soup is an HTML/XML parser for Python that can turn even invalid markup into a parse tree. It provides simple, idiomatic ways of navigating, searching, and m... 続きを読む
>>> from BeautifulSoup import BeautifulSoup >>> soup = BeautifulSoup(html) >>> soup.find('title',) <title>kishi-r.com: Ubuntuをインストールしました。</title> >>> soup.findAll('td',) [<td> </td>, <td> </td>, <td> </td>, <td> </td>, <td> </td>,... 続きを読む
IT, 勉強, Python明日はゆっくり出社予定のbonlifeです。id:eliya:20080113:1200259537 を読んで、Pythonの練習として、少し修正したものを書いてみました。Python使う人が増えると(めぐりめぐって私にとって必要なPython情報が簡単に手に入るようになって)良い... 続きを読む
Web サイトと対話するためのスクリプトは、基本的な Python モジュールを使えば作成できますが、その必要がないとしたら、わざわざ作成しようとは思わないでしょう。Python 2.x に組み込まれている urllib および urllib2 モジュールは、Python 3.0 で統一され... 続きを読む