タグ

ブックマーク / perltips.twinkle.cc (1)

  • Perl Tips | Perl で、サイトにアクセスして HTML を取得する方法

    LWP (libwww-perl という形で配布されている) を使う。LWP::Agent モジュールは、ウェブクライアント、ウェブオートメーション (ソフトウェアやプログラムが自動的にサイトにアクセスして情報を取ってくること) といったものの基である。もうはるか彼方、何年も前からある技術なのに基は変わっていないのがポイント。以下のスクリプトは、$URL で指定されているサイトにアクセスして、成功すればその HTML のコードをコンソールに表示、失敗したときはエラーコードを出力する例。CGI として機能させたときは、ブラウザには HTML コードでなく $URL でアクセスしたページを表示する。つまりプロキシとして動作するということ。 シンプルなバージョン #!/usr/bin/perl use LWP::UserAgent; use HTTP::Request; use HTTP::

    masasyou310
    masasyou310 2011/11/13
    perlで自動的にhtmlを取得 html解析
  • 1