タグ

2009年7月22日のブックマーク (2件)

  • perl - & はいつ使うべきか : 404 Blog Not Found

    2009年07月22日21:30 カテゴリLightweight Languages perl - & はいつ使うべきか 鋭い質問です。 Perlの謎(その10)サブルーチンの呼び出し方 - 燈明日記 組み込み関数と同名のユーザ定義関数を定義したときは、どうしても『&』付きでないと呼び出せないのです。id:chaichanPaPaの主張は、以下のとおり確認できます。 #!/usr/bin/perl use strict; use warnings; sub atan2{ "atanatan"; } print atan2(1,1), "\n"; しかし、実際にはビルトイン関数を上書きしているモジュールは少なくありません。たとえばCGI::Carpはdie()やwarn()を上書きしています。 それでは、ビルトイン関数の上書きはどうやるのでしょうか?そして、一旦上書きされたビルトイン関数を呼

    perl - & はいつ使うべきか : 404 Blog Not Found
  • 本文抽出モジュールを作り直す - download_takeshi’s diary

    2年ほど前にHTML::FeatureというPerl文抽出モジュールを書きました。 こいつはブログやニュース記事から「文らしき箇所」を適当に推測して抽出してくれるモジュールでして、リリースした当時はライバルもいなかったので、ブログなどでは結構反応がよかったです。外国の方も何人か使ってくれたりして、それなりに充実感のあるモジュールでした。 しかし、昨年HTML::ExtractContentが出現してからは、すっかりその地位を奪われ&忘れられた感がありました。作者としては「ま、いっか」的なノリだったのですが、最近になって急に「文抽出界での復権を目指し全面リメイクを敢行するよ!」と思うに至りました。 改善方針 方針ってほどの方針ではありませんが、 - サイトごとに定義できる部分はすなおに定義する - アルゴリズムに頼りすぎない - google adsenceの人気にあやかる - 全体

    本文抽出モジュールを作り直す - download_takeshi’s diary