タグ

2007年4月24日のブックマーク (1件)

  • 日本語を扱う(文字セットと16進数)

    charcode 変換 説明はどうでもいいから動くソースを出せという人は、後ろのほうへ… 文字コード? 日語をはじめとする多くのアジア言語は、0〜255 までしか表せない char 型ではとても表現できません。そこで、複数の char 型を組み合わせて表現しています。ところが、日語の場合この組み合わせ型に大きく3通りの方法があり、主に使用している OS によってその傾向が異なります。 この複数によって表される文字の数値「文字コード」と呼び、文字コードの番号付け、というか組み合わせの体系ことを「文字符号化方法 (character encoding)」とか「文字セット (character set)」などと呼びます。 伝統的に、Microsoft WindowsApple Mac OS では Shift_JIS (内部的には Unicode ですが) が使用され、サーバーで用いられ

    kminoru
    kminoru 2007/04/24
    文字コード判別