#!/usr/bin/env python2.6 #coding: utf-8 import urllib2 import chardet import sys import re # コマンドライン引数を取得 argvs = sys.argv if len(argvs) != 3: print "usage: python %s url regex" % argvs[0] quit() url = argvs[1].decode('utf-8') regex = argvs[2].decode('utf-8') # 引数の正規表現文字列を( )で囲んで、正規表現オブジェクトを生成 reg_patt = re.compile(u"(%s)" % regex) # WebページのHTMLを取得 html = urllib2.urlopen(url).read() # ページのエンコードを取得