lxml2.0からCSSSelectorが導入されたので、Web::Scraperのようなものを作ってみました。 とりあえず動作するところまでいったので載せておきます。機能はまだ全然足りてないので、簡単なことしかできません。 Python2.5とlxml2.0alpha が必要です。 Pythonはリストや辞書の中にある日本語をそのままprintで表示できないようなので、めんどくさいことに全部stringにして出力してます。 Web::Scraper - naoyaのはてなダイアリーよりキーワードページから必要なデータをもってくる例。 #!/usr/bin/env python2.5 from scraper import scraper, process import codecs, sys sys.stdout = codecs.getwriter('utf-8')(sys.stdou