タグ

ブックマーク / yanok.net (3)

  • 漢数字をソートすると - yanok.net

    こんなブログ記事があって、面白く読みました。 漢数字が数字順にソートされない理由を調べてみた 「数字順にソートされない理由」はリンク先のブログ記事に書かれているとおりですが、「数の順にソートされないこと」が意外だということが、私には興味深く思えました。「漢数字」ではなく「漢字」ととらえれば、数の順に並ぶ必然性が特にないことは自然と納得されると思います。 文字コードにおける漢字の並び順 『プログラマのための文字コード技術入門』にも書きましたが、文字コード規格における漢字の並び順をちょっとおさらい。 JIS X 0208/0213の場合: 第1水準漢字は読みの順番、第2〜第4水準は(その水準内で)部首画数順 Unicodeの場合: 部首画数順 (ただし、順序はブロック内でしか通用しないので注意) 第1水準の読みの順番は、音読みが多いですが訓読みのものもあります。また、第3水準は第1水準の前や第

  • Windows 7 のIMEの「繫」がおかしい - yanok.net

    Windows 7に添付のIMEで、JIS X 0213:2004で追加された「表外漢字UCS互換」10文字のうちのひとつ「繫」(第3水準、面区点位置1-94-94)の扱いがおかしいように見えます。 これは表外漢字字体表への対応のためにJIS X 0213の例示字形を変更しようとしたところISO/IEC 10646 UCS (Unicode)との対応に問題を生じるために追加された符号位置で、第1水準1-23-50の「繋」に対する「印刷標準字体」と呼ばれるものです。目を凝らしてみると左上部分の形が少し違うのが分かると思います。私は目が悪いのでこういうのは苦手ですが...。 Windows 7のIMEではこの字を入力できるのですが、「繁」と混同されているのか、「はんえい」と打鍵して変換キーを押すと「繫栄」なんてのが出てきたりします。 そんな言葉ないよねえ、とぐぐってみたら個人ブログや質問サイト

  • 「ユニコードは犯罪だからやめてください」の衝撃 - yanok.net

    新年早々、大笑いしてしまったこと。 下らないといえば下らないので書くまでもないかと思ったのですが、後で忘れた頃に読み返すと面白いかもしれないので書きとめておくことにします。 何があったのかは下記のページに詳しく書かれてあります。こちらを読んでいただければ、ぶっちゃけそれ以上のことはないです。 「LINEウイルス」の正体とは―LINE内で流行する「ウイルス攻撃」の現状について 簡単にまとめていうと、 LINE上で「ウイルス」なるものを送りつけることができるという噂があって、実際にそれを送りつけられるとLINEのアプリが誤動作(重くなる)らしい 実際のところ、ここで「ウイルス」と呼ばれているものはある特定の文字列である (プログラムではない。であるからしてウイルスでもない) 特定の文字列を受け取ると動作が極端に重くなる不具合のあるアプリがある、というのが真相らしい 問題を引き起こす文字列は、U

  • 1