[B! urllib2] ishideoのブックマーク

ishideo id:ishideo

urllib2に関するishideoのブックマーク (8)

nessy.info
ishideo 2020/06/03
python

tor

privoxy

urllib2

proxy
リンク
urllib2からの接続にTorを使う[Python][Mac] - Qiita
Torとは TorはIPアドレスを自身のアドレスを他のアドレスに偽装することができます。これは非常に良く出来ており、犯罪などに悪用されているほどです。悲しいことに日本の警察では手がかりにIPアドレスしかない状態になると犯人をほぼ確実に見つけれれません。ここ最近のTorを使用していた犯罪者がよく逮捕されていますが、恐らくIPアドレス以外から手がかりを見つけたのでしょう。 Torのインストール Macの人は HomeBrewからインストールできます。
ishideo 2019/05/09
python

pysocks

urllib2

socket

tor

qiita
リンク
urllib2をMock化してunittestする - Qiita
悪い例安易に最初に書いたコードがこれです。一件すると問題なさそうですが、これを実行すると1回目のアサーションは通りますが、2回目のアサーションでAssertionError: 'hoge' != ''となりエラーになります。 from nose.tools import * from mock import Mock from StringIO import StringIO import urllib2 import target def test_get(): urllib2.urlopen = Mock(return_value=StringIO('hoge')) eq_('hoge', target.get("http://dummy-url")) eq_('hoge', target.get("http://dummy-url"))
ishideo 2016/06/09
python

test

unittest

mock

urllib2
リンク
業種別企業名辞書データを公開しました - Y's note
Web解析Hacks ―オンラインビジネスで最大の効果をあげるテクニック & ツール作者: Eric T. Peterson,株式会社デジタルフォレスト,木下哲也,有限会社福龍興業出版社/メーカー: オライリー・ジャパン発売日: 2006/11/08メディア: 単行本（ソフトカバー）購入: 3人クリック: 78回この商品を含むブログ (21件) を見る企業名辞書業種と企業名の辞書データが欲しかったんでYahoo!FinanceのデータをCrawlして作りました。帝国データバンクや四季報のデータが使えると良かったんですが、Crawlできそうに無かったので諦めました。残念ながら2600社ほどのデータしか集まっておらず、個人的にはもっといろんなデータが欲しいです。他に良い方法をご存知の方いらっしゃいましたらご連絡いただけると幸いです。 Yahoo!ファイナンス - 株価やニュース、企業情
ishideo 2013/02/12
python

scrape

urllib

urllib2
リンク
furl: 使い易いPythonのURLライブラリ - karasuyamatenguの日記
https://github.com/gruns/furl インストール $ git clone https://github.com/gruns/furl.git $ cd furl $ ls API.md furl.py furl.pyc LICENSE.md README.md tests/setup.pyなどはない。 python2.7以上 python2.6でも使えるようにしたフォーク：https://github.com/tengu/furl $ python Python 2.6.6 (r266:84292, Sep 15 2010, 16:22:56) [GCC 4.4.5] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> from furl impor
ishideo 2011/12/15
python

furl

url

urllib

urllib2
リンク
The jonki
皆さんはPythonのpathlib使ってますか？私は非常によく使っています．例えば機械学習では学習の前に前処理を多く行うケースが非常に多いですが，このようなに知っておくと便利です．pathlibは意外とPython 3.4（2014年～）からとそれなりに新しいため，古くからのPythonユーザーは os.pathの方をよく使っているかもしれません．ただpathlibは文字列ではなくPathクラスとして扱ってくれることで，例えばLinux/Windowsのパス表記の違いを吸収してくれたりします． pathlibとos.pathの比較は公式のpathlibドキュメントに譲るとして，私がよく使うpathlibのクラスを紹介します．また今回改めてドキュメントを眺めて知った便利関数も多いので，公式ドキュメントに目を通すのもオススメします．今回は下記のような複数の素性の異なるデータセットに対して処
ishideo 2011/11/18
python

json

goo.gl

urllib2

module

shorten

url
リンク
Nothing is impossible : 簡単！たった８行のコードで HTML取得＆解析をするPythonスクリプト
June 07, 201010:49 カテゴリwork 簡単！たった８行のコードで HTML取得＆解析をするPythonスクリプト簡単！たった１３行のコードで HTML取得＆解析をするPerlスクリプトを見てPythonならもっと簡単だなーと思ったので書いてみる。 import urllib2 from lxml import etree url = 'http://www.yahoo.co.jp' opener = urllib2.build_opener() opener.addheaders = [('User-agent','Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0)')] tree = etree.parse(opener.open(url),parser=etree.HTMLParser()
ishideo 2010/07/26
python

urllib2

lxml

xpath

scraping

html
リンク
urllib2でプロキシを参照しないようにする - IT担当@谷根千辺り
Pythonurllib.urlopenはステータス404でも例外を発生してくれない。urllib2.urlopenはそのままだと環境変数のプロキシ設定を参照してするようで、ちょっと困る場合があった。というわけで、urllib2.urlopenでプロキシを設定|参照しないようにする方法。 #!/usr/bin/env python import urllib2 #今回はプロキシ設定を空にしておく #proxies = {'http': 'http://www.example.com:3128/'} proxies = {} #プロキシハンドラーの作成して handler = urllib2.ProxyHandler(proxies) #プロキシハンドラーを指定してURL Openerを作成して opener = urllib2.build_opener(handler) #作成したURL
ishideo 2008/08/06
urllib2

python

proxy
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx