タグ

Unicodeに関するkarronoliのブックマーク (3)

  • Unicodeは麻雀牌すら表現してみせる : mwSoft blog

    この前、Unicodeのブロックを見ていた時に、麻雀牌が割り当てられたブロックがあるのを見て笑った。誰が登録したんだろう。 もっと面白いものがないか探してみたけど、けっこう変なものが登録されていてやっぱり笑った。混沌という言葉が似合う気がした。 以下、見ていて気になった者ども。 1. Unicodeには麻雀牌用のコード領域が確保されている U+1F000-1F02F Mahjong Tiles http://unicode.org/charts/PDF/U1F000.pdf まだあまり対応されていないけど、対応率が上がったらテキストだけで麻雀できます。JavaScript+テキストで画像一切なしの麻雀ゲームを作る人が出没すること請け合い。フォントカラーを変えることで赤ウーも表現可能。ただ、点棒は登録されてないので、そこだけ画像を使う必要があるかも。 2. 六十四卦(易という占いで使われるも

    karronoli
    karronoli 2014/07/15
    おもしろい.
  • perlunicode - Perl における Unicode サポート - perldoc.jp

    Unicode support is an extensive requirement. While Perl does not implement the Unicode standard or the accompanying technical reports from cover to cover, Perl does support many Unicode features. Unicode サポートは大規模な要求です。 Perl は標準 Unicode や付随する技術的なレポートを一つ残らず 実装しているわけではありませんが、多くの Unicode 機能を サポートしています。 People who want to learn to use Unicode in Perl, should probably read the Perl Unicode tutorial, per

    karronoli
    karronoli 2013/07/03
    podにもあった.「適切な encoding が指定されていれば、Perl スクリプトの中の識別子で 表意文字を含めた Unicode の英数字を含めることができます。 」
  • UTF-8 エンコーディングの危険性 - WebOS Goodies

    的に、まともな国際化ライブラリを使っていれば、上記のような不正な文字コードはきちんと処理してくれるはずです。実際、 Opera, Firefox, IE ともに適切にエスケープしてくれました。また、 UCS に変換した後にエスケープ処理を行うことでも対処できるかもしれません。しかし、複数のモジュールで構成されるような規模の大きいアプリケーションでは、そのすべてが適切な処理を行っていると保証するのも、なかなか難しいかと思います。ここはやはり、すべての外部入力に含まれる不正なシーケンスを、水際で正規化するという処理を徹底するのが一番かと思います。 例えば Ruby の場合、不正な UTF-8 コードを検出する最も簡単な方法は、 String#unpack を使って UCS へ変換してみることです(昨日の記事への kazutanaka さんからのはてぶコメントにて、 iconv でも同様なこ

    karronoli
    karronoli 2013/01/06
    "UTF-8の非最小形式の問題"って呼ぶの? なるほど,な問題だ.perlのdecode_utf8のCHECK=1で確認したらutf8 "\xC0" does not map to Unicodeってなった./正規化ってNFCとか関係じゃなくてバイト列を一意に扱うって話?
  • 1