ソースやeasy_installで実施をすると、xslt-configがバッチコマンドとして認識されていないと MinGWが入っていても怒られます。 libxsltがない為に問題が発生するようですが、libxsltは調べた限り結構導入が 面倒な感じでした。最新の2.1βは使えないですが、2.05だと、pypiに インストーラー形式でアップされていました。 http://pypi.python.org/pypi/lxml/2.0.5 インストーラー化してくれるている方に感謝☆m(_ _)m
ソースやeasy_installで実施をすると、xslt-configがバッチコマンドとして認識されていないと MinGWが入っていても怒られます。 libxsltがない為に問題が発生するようですが、libxsltは調べた限り結構導入が 面倒な感じでした。最新の2.1βは使えないですが、2.05だと、pypiに インストーラー形式でアップされていました。 http://pypi.python.org/pypi/lxml/2.0.5 インストーラー化してくれるている方に感謝☆m(_ _)m
はじめに こんにちは、Python界の炭酸x2倍のジョルトコーラです。なんか適当に書いたコードが予想外にはてブ付いたので「みんな好きモノなんだなー」と思いました。同期なコードだとURL増えたときに詰まっちゃうので、非同期なやつもちょろっと紹介しますよ。 あ、くれぐれも闇雲なスクレイピングはしないでくださいよ。DoS攻撃と変わらないですから。捕まっても僕は責任とりませんよ。 リンク 5分でWebスクレイピングをする - YAMAGUCHI::weblog 前回のエントリ。これは直列なコードなのでURLが増えれば増えるほど線形に遅くなる。 やってみよう おさらい 前回は指定した複数のURLのページにあるHTMLからaタグを全部抜き出す、というようなことをしたのでした。で、今回はそれを非同期化しましょうという話。 非同期にしたいところ 前のコードでforとかになってるところは基本的に同期じゃなく
一部で最強と呼ばれているPythonには, virtualenvやipythonのような絶対入れる超定番以外にも, あると便利なライブラリというものがあります. ここではラッキーセブン, 7つご紹介しましょう. なお, furl以外は3.xに対応しています. requests 覚えやすいWebリクエスト(urllib.request.urlopenの代替) furl URLの扱いをもっとシンプルに(urllib.parse.urlparseの代替) PyQuery jQueryのスクレイピング力をPythonに(html.parser.HTTPParser, lxml, BeautifulSoupの代替) Send2Trash/Send2Trash3k クロスプラットフォームな「ごみ箱へ送る」 Windows向けPythonランチャー 2.xと3.xを切り替える PySide/PyQt4
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く