タグ

ブックマーク / yanok.net (2)

  • 正規化を使いたくても - yanok.net

    あるときJavaプログラムで、入力されたテキストデータに含まれる所謂「全角・半角」の区別を無視したいことがありました。例えば「RAM」という言葉が含まれていたら、所謂「全角」であろうが「半角」であろうがそれは同じ文字なので、重複符号化のせいにすぎないそういう非質的な区別は無視したいわけです。 当ならこれぞまさに正規化処理の出番で、JavaではUnicode正規化が簡単に使えるようになっているのですが、しかしUnicodeの正規化仕様はちょっと使いづらいところがある。 というのは、通常の正規化形式であるNFC, NFDはいずれも、「全角・半角」の区別をそろえてくれないので私の目的の役には立たない。一方、NFKC, NFKDはというと、「全角・半角」をそろえてくれるのはいいのだけど、三点リーダがピリオド3つになってしまうとか、記号類について余計なお節介をしてくれて何がどうなるのか正直私も覚

  • 台風の絵文字 - yanok.net

    昨日は台風15号が州に上陸し、各地で被害や混乱が発生しました。 そんな中、PCでmixiを見ていたら、気になる絵文字がありました。mixiのサイトでは画像形式の絵文字が使えます。台風に関した誰かの書き込みの中に、台風の渦巻きのような絵文字が使われていました。問題は、その渦が、日にやってくる台風の渦とは逆方向に巻かれていたことです。 学校で習うとおり、台風というのは低気圧の一種で、低気圧は反時計回りに吹き込む渦になります(北半球の場合)。それなのに、mixiの台風の絵文字は時計回りに描かれていたのです。(厳密には、mixiの問題の絵文字当に台風を意図したものなのかというのは必ずしも明確でないのですが、雨や雪や雷の並びに配置されているのできっと台風なのでしょう。それに、南半球での使用を意図したものでないことは明白です) ありゃりゃ、これは情けない。それでは携帯電話の絵文字はどうなのかと

  • 1