今回は Python の標準モジュールである urllib2 と HTMLParser クラスを使って Web 上のリソースにアクセスし、取得した HTML を解析する方法について説明します。 Web上からHTMLを取得 Python で Web 上にあるリソースにアクセスするためには urllib2 の urlopen() を使用します。以下のサンプルプログラムでは、指定した URLから HTML を取得し、その取得した HTML をそのまま表示しています。 # -*- coding: utf-8 -*- import urllib2 if __name__ == "__main__": url = "http://www.python.org" # Pythonの公式ページのURL response = urllib2.urlopen(url) # URLを指定してHTMLファイルを開