タグ

2011年3月2日のブックマーク (3件)

  • WWW::Mechanize::Firefox

    javascriptでDOM操作しまくっているサイトをスクレイピングする作業が発生しそうなのだけどWWW:Mechanizeではできないらしくて、ちょっと調べてみた。 すぐに思いついたのはWWW::Seleniumなんだけど使ったことないなぁ。で、CPAN探したらWWW::Mechanize::Firefoxを見つけたのでインストールして使ってみた。 僕のブログの404ページはページがロードされると、AjaxでtagのJSONをゲットしてきて表示するようになっているので、そのページのスナップショットを撮ってみた きちんとjavascriptを解釈している use WWW::Mechanize::Firefox; my $mech = WWW::Mechanize::Firefox->new(); $mech->get('http://blog.kzfmix.com/404'); my $r

    WWW::Mechanize::Firefox
    kzfm
    kzfm 2011/03/02
    WWW::Mechanize::Firefox
  • WWW::Mechanize::FAQ - WWW::Mechanizeの良くある質問と回答

    NAME ``X''はどうやればできるの? 「これこれをこうする」ことはWWW::Mechanizeでできる? プロキシサーバー経由でWWW::Mechanizeを使うにはどうすれば良い? 全てのフォーム上のフィールドを見るにはどうすれば良い? JavaScriptをWWW::Mechanizeで実行させるにはどうすればよい? 何で動かないのさ? https:// なURLだとなんで動かないの? ``Input 'fieldname' is readonly''って言われるんだけど、何で? 「これこれをこう」しようとしたら、怪しげなエラーが出たんだけど? Author NAME WWW::Mechanize::FAQ - WWW::Mechanizeの良くある質問と回答 ``X''はどうやればできるの? 「これこれをこうする」ことはWWW::Mechanizeで

    kzfm
    kzfm 2011/03/02
    何を使えばいいんだ?
  • WWW::Mechanize::FAQ - WWW::Mechanizeの良くある質問と回答

    kzfm
    kzfm 2011/03/02
    何を使えばいいんだ?