pyqueryはjQueryみたいにCSS SelecterでDOMとれるよ、ってやつ どれも pip(or easy_install) から pip install lxml pip install pyqueryubuntuだと apt-get install python-lxml しないとlxml入らなかった はてなホッテントリの記事一覧をとってくる #!/opt/local/bin/python # -*- encoding:utf-8 -*- from pyquery import PyQuery as pq import urllib2 url = "http://b.hatena.ne.jp/hotentry" opener = urllib2.build_opener() opener.addheaders = [('User-agent', 'mozilla 3.6')