タグ

2011年11月30日のブックマーク (2件)

  • PHPでスクレイピング xpathとscrape_func.php : 目指せ1級!30代サラリーマンボルダリング日記

    ここ最近というか結構前からhtmlスクレイピングすることが多いのでメモ。 最初はいろいろ試してたんだけど、今使ってるのは2パターン。 ベンチマークとって最速だったからとかじゃなく、単に慣れかも。 このオライリーののサンプルコードに含まれているファイル。 http://www.oreilly.co.jp/books/4873111870/download.html 始点と終点書いて直感的に取ってこれる。 $_rawData = getURL($url); $_rawData = mb_convert_encoding($_rawData, "UTF-8", "auto"); $_rawData = cleanString( $_rawData ); $headline = getBlock("<div id=\"headline\">","</div>",$_rawData,false);

    PHPでスクレイピング xpathとscrape_func.php : 目指せ1級!30代サラリーマンボルダリング日記
  • HTTPで正しくキャッチボールをするには | Lab by engineering@dwango.jp

    皆さんはキャッチボールは好きですか? 私はバスケットボールの方が好きです。 キャッチボールは、自分と相手双方がボールをうまくキャッチできるように投げる必要があります。これは、サーバーとクライアントの間でも同じで、クライアントから投げられたボール(リクエスト)をサーバーは正しく投げ返す(レスポンス)必要があります。 ここで、サーバーがボールをあさっての方向に投げたり、異常なスピードで投げ返すとどうなるでしょうか。おそらくクライアントはそのボールを取ろうとしますが、追いつけずにボールを落としたり、どこかにぶつけたりしてしまうでしょう。 今回は、HTTPについて、どうして正しくレスポンスを返さないといけないのかということについて、Rackを使用して解説していきます。 対象読者 Webアプリケーション開発に興味のある方、これから開発を行おうとしている方 Rackについて まず、今回使用するツール

    snaflot
    snaflot 2011/11/30