タグ

2006年7月10日のブックマーク (3件)

  • 誤字等の館

    ようこそ、「誤字等の館(ごじらのやかた)」へ。 世の中には、様々な誤字が満ち溢れています。 メジャーな勘違いから、単なる誤変換、ウケ狙いのネタもあれば、どうやったらこんな誤字ができるのか理解不能なものまで。 こういった誤字たちを総称して、「誤字等(ごじら)」と呼ぶことにしてみました。 WEBサイトを何気なくながめているだけで、誤字等はたくさん見つけることができます。 そういった誤字等を検索エンジンにかけてみて、どれくらいヒットするかを調べて考察を加えたものがこの「誤字等の館」です。 考察といっても、そんな大層なものではなく、適当な推論です。 当方、言葉の専門家でも研究者でもありませんので。 このサイトでは、誤字等の生みの親達を責めているわけではありません。 笑うつもりも、馬鹿にするつもりもありません。 ただ、どうしてこんな誤字等が生まれてくるのか、その理由には興味があります。 気の向くまま

    誤字等の館
  • Rabin Karp アルゴリズムでコード重複の検出 blog.bulknews.net

    Rabin Karp アルゴリズムでコード重複の検出 YAPC::NA で会った Fotango の Norman Nunley がつくってる Algorithm::RabinKarp モジュールが面白げです。 Rabin Karp 文字列探索アルゴリズム (wikipedia) を使って文字列のハッシュ(ダイジェスト)をチェックし、同一の値を示す部分を重複しているとみなしてレポートしてくれます。つまり、プロジェクト内のコードのコピーペーストを検出するツールとして使えるというわけ。 ためしに Plagger で試してみた結果は rabin.txt のようになりました。プラグインの register_hook や CustomFeed での Feed オブジェクトの生成など、イディオム的に使う部分が大半になってしまっていますが、いくつか実際コピペで再利用しているコードが検出できています。 c

  • u-maker.com

    This domain is registered at Dynadot.com. Website coming soon.

    atyks
    atyks 2006/07/10