というわけで、Larry Wallの来日とともに、いきなり連載スタートです。3月29~30日に開催されたYAPC::Asia::2006に合わせて5年ぶりに来日したLarryは、実は我が家の賓客でもありました。またとない機会なのでインタビューしてみた次第。なお、Larryが日本語で話した部分は《~》でくくっています。 撮影:武田康宏 弾(筆者):日本語はどれだけ話せるのですか? ラ(Larry):《簡単に会話を遅くします。でもペラペラじゃない。5年かけて少しずつ勉強しました。でも、練習することがあまりできません。本だけで簡単に…》 弾:ひょっとしてまだ1977年版Honda Accordに乗っているんですか? ラ:はい。もう29歳です。廃車にすると、環境条例でカリフォルニア州が500ドルくれるのですが、まだ乗ってます。 弾:最近お気に入りのアニメは? ラ:《あずまんが大王! ちよち
先日 PerlでCSSセレクタ で HTML::Selector::XPath がいい感じであると思ったわけですが、CSS セレクタだけじゃなく何気に HTML::TreeBuilder::XPath とのコンボがすげーイイ!ということにいまさら気づきました。 HTML::TreeBuilder::XPath で findnodes するとツリー状に連なった HTML::Element なデータ構造が返ってくるんですが、HTML::Element は API をかなりいろいろ持ってて、これをうまく使ってやるとスクレイピングを自然な感じで書けます。 例えばはてなダイアリーの任意のページから、本文部分だけをスクレイピングしたいと思ったときにキーワードリンクが邪魔だったりするわけですが、とりあえず HTML::Selector::XPath で div.section をぶっこ抜いて取れた HT
HTML::Selector::XPath をリリース CSS Selector in Perl とか subtech - Bulknews::Subtech - CSS selector to XPath あたりで議論していた CSS 2 Selectors to XPath コンパイラなモジュールをつくって、CPAN に HTML::Selector::XPath としてリリースしました。 使い方は naoya さんが先に書いてますが、HTML から正規表現を使うことなくスクレイプするのに便利。たとえば Mixi にログインしてマイミク最新日記と、1件目のタイトル、本文を抜き出すコードが、以下のようにかけます。 #!/usr/bin/perl use strict; use warnings; use utf8; use Encode; use HTML::Selector::XPat
2007年03月08日22:45 カテゴリLightweight Languages perl - 顔を認識するcgi というわけで、やってみた。 spiritlooseのはてなダイアリー - OpenCVを使って画像の物体認識をするPerlモジュール作った これでとりあえずPerlのみで顔認識のWebサービスとかつくれると思います。 Source http://www.dan.co.jp/~dankogai/img-objdetect/detect_face.src 仕様上の注意 顔検出したい画像のURLを、 http://www.dan.co.jp/~dankogai/img-objdetect/detect_face.cgi/ の後ろにつけるだけ。 完全なα版。「動かない」「検出しない」とか文句を言わないように。 FreeBSDで動かすのはちょっと大変だった。ports版のopenc
Perl、PHPでGooglebotを一定の確率ではじく 2007-05-01-2 [Programming] 「動的生成ページへのGooglebot(Googleのクローラ)のアクセス数 が多すぎてサーバに負荷がかかりすぎる問題」に悩まされています。 robots.txt の Crawl-delay は効かないし[2007-03-21-1]、 Googleウェブマスターツールでクロール率を低く設定しても ある回数よりも下がらないしで困っていました。 アクセス禁止にすれば完全解決なのですが、 それにより検索されなくなるのはファインダビリティが下がって嫌なので、 とりあえずランダムで 503 を返すことで対処しました。 ときどき503が出ることにより、しばらくするとGooglebotが 「サーバが混んでいるんだな」と思ってくれるみたいで、 結果としてクローラのアクセス数が激減、かつ、検索結果
This page is dedicated to the CRONw - CRON for Windows Project at sourceforge.net. CRONw is a small collection of Perlie things providing the main functions of a *nix-style CRON to the Perl-enabled Windows world. The killer feature and the reason I built it: It runs as a system service without any additional tools, using the functionality provided by Win32::Daemon. All you need is a 32-Bit ;) Wind
「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く