タグ

pythonとmechanizeに関するsteropeのブックマーク (7)

  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • [J] Python 版 Mechanize でスクレイピングやクローリングをっ - Jamz

    なぜ、Python にこだわるのか... 理由はない、なぁ... このライブラリについては以下のあたりのメソッドを一通り理解しておくと色々想像が膨らんで、創造的なスクリプトが組めそう。 br = mechanize.Browser() br.links(url_regex="regex_val") br.follow_link(text_regex="anchor_text") 公式のドキュメントは以下だけど、もう少し実装例や解説が欲しいなぁ。 mechanize documentation 実装例いろいろ。 [python]Python で 画像スクレイピング - Programming Must Go On mechanizeを使ってマイミク全員に足跡を残すサンプル - bonlife はてなのバックアップスクリプトをPythonに移植してみた - とある誰かの覚え書き mechan

  • mechanizeちょうべんり - 見ろ!Zがゴミのようだ!

    長い休み明けぐらいはまともな記事で。 はてブやらtwitterやらは記事をまとめて書く気力を失わせるな… 最近、業務でサイト上での作業の自動化を検討してたところ、見つけたのがmechanize。 元は perlのWWW::Mechanizeをpythonに移植したもので、要はブラウザの動作をスクリプトでシミュレートするというもの。 これを使うとurllib2あたりで一々GET/POSTを書かなくても、「ここをクリックしてこのフォームに文字を入力…」みたいな感覚でWebサーバとのアクセスをスクリプトで記述できる。 使い方は家サイトや後述するサイトを参考して頂くとして、簡単なTipsを。 ファイル選択フォームを使ってファイルをアップロードしたい Formでファイル入力タイプの項目(input type="file")があった場合はadd_file()メソッドを使う。 from mechani

    mechanizeちょうべんり - 見ろ!Zがゴミのようだ!
  • [python]Python で 画像スクレイピング - Λάδι Βιώσας

    突然ですが、いままでちょっとしたメモ書きを hiki や、このブログに書いていたわけですが、Emacs Wikiを使うようになって、これが便利すぎて、メモ書きは全部 Emacs-Wikiに書くようになってしまいました。 そんなわけで、ただでさえあまり更新されないこの日記の更新頻度がさらに少なくなってしまいそうです。や、まあ Wiki に書いてることをを公開すればいいんですけど。。。まぁいいや。そこで、日記書くネタのために、Python の Mechanize で遊んでみました。 まず、インストール。 sudo portinstall -P www/py-mechanizeports にあったので、easy_install は使いませんでした。うーん、FreeBSDは楽でいい。 さて、、、Mechanize を使って何を書こうかと悩んでいたところ、そういえば、昔、しょこたんブログの画像を一気

    [python]Python で 画像スクレイピング - Λάδι Βιώσας
  • Python Mechanize を使ってみる - 傀儡師の館.Python:楽天ブログ

    2006.10.15 Python Mechanize を使ってみる (1) カテゴリ:その他 mechanize (Web ブラウジングをプログラムするための Python のモジュール) を使ってみることにした。mechanize は、Andy Lester さんの WWW::Mechanize (Perl 版) を参考に Python で実装したものようだ。WWW::Mechanize の日語情報を眺めてみる。このページにあるものや、サンプルスクリプトが参考になりそうだ。file upload script for sourcefourge.jp のように Mecab の sourceforge.jp へのアップロードにも使われているようだ。これも参考になるスクリプト。 urllib を使えばページをとってきたりするのは楽にできるのだが、その後、とってきたページを解析して、そこから

  • mechanizeではてなダイアリーを更新する - ひきメモ

    Pythonに手を出してみようと思います。「Hello, World!」と表示するスクリプトを書いても面白くも何ともないので、mechanizeを使ってはてなダイアリーを更新するスクリプト書いてみます。 mechanizeのインストール mechanizeをインストールるにはeasy_installというRubyでいうところのgemのようなものが必要らしいので、それを先にインストールします。 wget http://peak.telecommunity.com/dist/ez_setup.py python ez_setup.py続いてmechanizeをインストール easy_install mechanizeこれでLib/site-packages以下にeggファイルが作成されます。これはzip形式の圧縮ファイルで、解凍しなくてもライブラリとして使用できるみたいです。通常ファイルとして

    mechanizeではてなダイアリーを更新する - ひきメモ
  • Python - HeyWiki

    Python用モジュールMechanizeのメモ br = mechanize.Browser() br.open("〜.html") とすると、仮想ブラウザが作られて、〜.htmlが読み込まれる。 response = mechanize.urlopen("http://www.smlab.tutkie.tut.ac.jp/") print response.read() とかすると、http〜のHTMLが吐いたデータを表示(一回だけ) もしくは、 response = br.response() とやっても、同じこと(br.open()した後) for link in br.links(): print link とかやると、現在のページに存在する全てのリンクを表示 br.find_link(text_regex = "ログイン") とかやると、ログインというところに張られているリンク

  • 1