タグ

コンテンツとtxtに関するZAORIKUのブックマーク (1)

  • 2008年、Webは文字列解析で変わっていく

    実際のHTMLコンテンツは、contentメソッドで取得できる。このcontentメソッドは、どのような文字コードで書かれているのか分からない。 連載では、ここまでEncode::Guessを使って自動判定をしてきたが、「自動巡回」という面では、さまざまなコンテンツが混じるということから、「Content-Typeヘッダ」を見てエンコードしたほうがよいだろう。そのコード記述は次のようになる。 use HTTP::Response::Encoding; # 内容を取得 my $content = $mech->content(); # レスポンスを取得 my $res = $mech->response(); # 文字コード変換 # 1. Content-Typeから判定 my @encoding = ( $res->encoding, ($res->header('Content-Typ

    2008年、Webは文字列解析で変わっていく
  • 1