指定した URL へのリンクのアンカーテキストを収集する 2006-09-12-1 [YahooHacks] 今回の YahooHacks は「アンカーテキストの収集」です。 とはいえ、文字コードにはまったー! 「./hack_anchor.pl http://www.yahoo.co.jp/」を実行すると、 「UTF-16LE:Malformed LO surrogate dab3 at /usr/lib/perl/...」 などと怒られて落ちるのですが(環境によって異なるみたい…)、 これを skip するにはどうしたら良いのでしょうか? とりあえず、decode のところを eval してみました…。 ■■■あるページへのリンクのアンカーテキストを収集する 同じページを指すハイパーリンクのアンカーテキストにはいろいろと バリエーションがあります。 例えば、 ht
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く