タグ

2008年11月30日のブックマーク (4件)

  • PHPにおけるUnicode文字列の正規化

    Unicodeでは、意味的に同じ文字を複数の方法で表現することができます。しかし、表現がバラバラなままだと、検索などで問題が発生することは容易に想像できます。そのため、表記を統一する仕組みとして「正規化」が用意されています。稿ではPEARのI18N_UnicodeNormalizerを用いて、PHPでUnicodeの正規化を行う方法を紹介します。 はじめに 与えられた文字列を含む文書を返す検索機能を実装しているところを想像してください。 検索語として「ページ」が与えられれば、「ページ」という文字列を含む文書を返します。これは特に難しいことではありません。 半角の「ページ」が与えられたらどうでしょう。「ページ」と「ページ」を区別する必要がないような、一般的な文書検索においては、「ページ」という文字列を含む文書を返すのが望ましいはずです(もちろん、この2つは常に同一視できるわけではあ

    PHPにおけるUnicode文字列の正規化
    tenkoma
    tenkoma 2008/11/30
  • 文字参照からUTF-8への変換

    MySQLだけでは、難しいでしょう。 php4.0.6以降なら mb_decode_numericentity ( $string, $convmap, 'utf8' ) でHTML 数値エンティティから、指定文字エンコードの文字列に変換してくれます。 16進数でも10進数表現でも大丈夫のようです。 詳しい使い方は、マニュアルを参照して下さい。 http://jp.php.net/manual/ja/function.mb-encode-n … テスト例:mysqlとの連携は前後で適宜行って下さい。 <?php //このソースはutf8で保存して、出力をutf8にするよう、phpの設定をしておいて下さい $str = '㈠㈪㈱㈾㉁'; // (一)(月)(株)(資)(休) print '<ul><li>数値文字参照:' . $str . "\n"; $ss = entity_to_utf(

    文字参照からUTF-8への変換
    tenkoma
    tenkoma 2008/11/30
  • ★自動販売機に騙されました! - ★自動販売機に騙されました!先程、我が家のすぐ前に設置してある自動販売機で業者が缶コー... - Yahoo!知恵袋

    ★自動販売機に騙されました! ★自動販売機に騙されました! 先程、我が家のすぐ前に設置してある自動販売機で 業者が缶コーヒーの補充を行っていました。 雨の中カッパを羽織っての作業は大変だなと思うと、 急に缶コーヒーが飲みたくなりました。 私は普段は「COLD」を買うのですが、 今日の東京は雨が降っていて寒いので (質問を書いている間に雨はあがりました) 「HOT」を買うことにしました。 ところが出てきた缶は冷たいのです。 「おかしいな?」と思ってもう1買ってみましたが、やっぱり冷たいです。 入れ間違いかなと思って、もう1つあるほうの「HOT」のボタンを押してみましたが、やっぱり冷たいです。 10買ってみましたが、出てきた缶は全部冷たいです。 そこで私は、その缶コーヒーが補充したばっかりだということを思い出しました。 そこで質問です! 「HOT」と書いてある所に補充するんだから 最初から

    ★自動販売機に騙されました! - ★自動販売機に騙されました!先程、我が家のすぐ前に設置してある自動販売機で業者が缶コー... - Yahoo!知恵袋
    tenkoma
    tenkoma 2008/11/30
    w >もうハラワタが煮え栗饅頭です!!
  • kendama high technique play けん玉段の技、高度な技14種

    http://trbjp2.blog71.fc2.com/blog-category-2.html Twitter http://twitter.com/#!/hrd_y Facebook Profile http://www.facebook.com/harada.yuuki

    kendama high technique play けん玉段の技、高度な技14種