タグ

2009年3月9日のブックマーク (4件)

  • http://wota.jp/ac/?date=20090308

  • Unicode汚染の危機 - Googleによる絵文字収録の愚行

    CNetの記事によると、Googleが携帯電話で使われる絵文字を国際的な文字コード規格、Unicodeに収録しようというプロジェクトを進行中だそうである。 しかしこれはデータの設計という観点からすると極めて愚かな行為である。今日は声を大にしてこのような愚行に対して異を唱えたい。絵文字をUnicode化してはいけない理由は次の通りである。 1. 絵はあくまでも絵であって文字ではない。 絵文字は言語の一部を形成するものではない。単語に利用することも出来ないし、文字自体を発音できるわけでもない。文字コードに文字以外のデータを導入するべきではない。 2. 別の解決法が存在する。 そもそも絵文字の問題はマークアップ処理すれば解決する。例えば端末自体がHTMLメールを送信することが出来ればまったく問題にならない。 3. 互換性の問題。 文字を利用するアプリケーションはなにも携帯メールだけではない。Go

    Unicode汚染の危機 - Googleによる絵文字収録の愚行
  • regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found

    2009年03月09日00:30 カテゴリLightweight LanguagesTips regexp - ^$でなくて\A\zを使おう まずは回答から。 正規表現で「制御文字以外」のチェック - ockeghem(徳丸浩)の日記 文字エンコーディングの妥当姓 制御文字(\x00〜\x1f, \x7f)のチェック 文字列長のチェック このうち後ろ二つを正規表現として書くにはどうすればいいかを考えていました。 こういう時には、「全文字がOKならOK」と考えるのではなく、「一文字でもNGならNG」と考えると楽になります。それは「スペースと非制御文字以外」なのですから、/[^ \S]/が求めていた正規表現で、=~ではなく!~が使うべき演算子ということになります。全角スペースもOKにしたければ、/[^ \x{3000}\S]/。[追記参照] [Run via Codepad] #!perl -

    regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found
  • 賭け対象はJ2までも…/クロアチアのブックメーカー事情 | クロアチア・サッカーニュース | スポーツナビ+

    2009年03月08日 賭け対象はJ2までも…/クロアチアのブックメーカー事情 7日、Jリーグが開幕しました。 ディナモ・ザグレブからサンフレッチェ広島に移籍したMFミハエル・ミキッチも勝利に貢献する活躍をしたそうで嬉しいですね。クロアチアのメディアでも速報的に記事を書かせてもらいました。 日から遠く離れたクロアチアでも最近はネットで試合を観戦することが可能で、今日は名古屋グランパスvs.大分トリニータ、鹿島アントラーズvs.浦和レッズ、そしてWBCの日vs.韓国をハシゴして見てました。ほんと凄い時代になったな、と思います。 さて、ここクロアチアでスポーツ好きな輩と話をすると、Jリーグの認知度がかなり高いことを知ります。例えば、「KASHIMA(鹿島)」と「KASHIWA(柏)」の違いが分かる人も結構多いのです。日サッカーファンでもクロアチアのクラブ名はそうそう出ないこと

    perezvon
    perezvon 2009/03/09
    「KASHIMA(鹿島)」と「KASHIWA(柏)」の違いが分かる人も結構多い