タグ

ブックマーク / www.geekpage.jp (4)

  • Perl : HTML::TreeBuilderによるパース(リンクの取得)

    ここでは、取得したHTTPメッセージのbody部分に含まれるHTMLを解析してAタグ内に含まれるリンクURLを取り出す方法を説明したいと思います。 HTTPクライアントサンプル 以下にHTTP::LiteとHTTP::TreeBuilderを利用したクライアントを示します。 まず、Aタグを順次取得しています。 次に、取得したAタグに含まれるhref attributeをprintしています。 #!/usr/bin/perl use HTTP::Lite; use HTML::TreeBuilder; $http = new HTTP::Lite; # URL部分を変更して下さい $req = $http->request("http://www.hogehogeURL.com/") || die $!; $body = $http->body(); $tree = HTML::TreeBu

  • Geekなぺーじ : Perlネットワークプログラミング

    TOP > プログラミング > Perlネットワークプログラミング > Perlネットワークプログラミング Perlネットワークプログラミング ここでは、Perlを使ったネットワークプログラミングを説明します。 簡単なTCPサーバとクライアント HTTPサーバの作成(TCPサーバサンプル) HTTPクライアントの作成(TCPクライアントサンプル) HTTPクライアントの作成(HTTP::Liteを利用) HTTP_USER_AGENTを変更したHTTPクライアント(LWP::UserAgent) 取得したHTMLのパース HTML::TreeBuilderによるパース(Titleの取得) HTML::TreeBuilderによるパース(Headの取得) HTML::TreeBuilderによるパース(リンクの取得) HTML::TreeBuilderによるパース(解析結果をdump) HT

    artzt
    artzt 2010/06/16
  • アクセスログ解析

    webページ(ホームページ)は、ユーザに見せるための物です。 ユーザが何を求めてホームページに来たかを把握できればより良いホームページが製作できます。 ユーザがホームページを訪問するとアクセスログと呼ばれる記録が残ります。 ここでは、そのアクセスログを解析することにより色々な情報を引き出す方法を説明したいと思います。 ただし、ここで説明する方法は多少特殊かも知れません。 一般的には世の中にあるツールを使ってアクセスログ解析を行いますが、ここでは、生のアクセスログから情報を抽出する方法を説明して行きたいと思います。 もしかすると、アクセスログの読み方、ツールの作り方に近いかも知れません。 アクセスログからわかること アクセスログを解析すると以下の事が解ります。 どのページが閲覧されているか ユーザはどのような順番でページを閲覧しているか どのような場所からホームページにたどり着いてきたか 何

    artzt
    artzt 2008/06/22
    はてな、blogline googlereaderの解析スクリプトの作り方
  • Geekなぺーじ : プログラミング

    ここでは、初心者から中級者向けプログラミング解説を行います。 初心者向け以外は、内容の多くがネットワークに関連するものになっています。 ただし、ネットワーク関連だけではなく、それ以外も多少含まれています。 ある程度、思いつきでコンテンツを増やしていく予定です。 暖かく見守っていただければ幸いです。 解らない、解りにくい、解説されていない部分がありましたら、是非ご質問下さい。 質問を頂けるのは内容のチェックにもなり、ありがたいです。 ただし、場合によってはご期待に添えない事もあり得ますのであらかじめご了承下さい。

  • 1