タグ

文字コードとutf-8に関するmn36555023のブックマーク (2)

  • Shift_JIS文化からUTF-8への移行ガイド - Qiita

    まだまだ場所によってはShift_JIS文化は根強く、2015年が終わろうとしている現在でも、「ようやく我が社もUnicodeでシステムを作ることを考えるっ!」なんてところは多くあるかと思います。 そんな現場で、これまでJavaでShift_JISでシステム構築してきたSIer向けのUTF-8移行ガイドです。 文字長のチェック 文字長の入力チェックはShift_JISの世界では、半角文字は1バイト、全角文字は2バイトなので、以下のようなチェックロジックになっていたかと思います。 if (inputValue.getBytes("Windows-31j").length > 20) { errors.add("hoge", new ActionMessage("errors.maxlength", "ほげ", 10)); } UTF-8ではそれらの文字は、1バイト~3バイトで表されるので、バ

    Shift_JIS文化からUTF-8への移行ガイド - Qiita
  • 第4回 入国管理局正字

    2012年7月、日に3カ月以上在留する外国人は、在留カードの携帯が義務付けられた。在留カードには、氏名、生年月日、性別、国籍、住所などが記載されている。在留カードの氏名は、通常はアルファベット(ローマ字)大文字のみによる記載となるが、申し出により漢字で記載することもできる。 この在留カードの外国人氏名に使える漢字が、入国管理局正字(以下、入管正字)であり、2011年12月の「法務省告示第582号」で定められている。 入管正字は、漢字1万3285字を収録する漢字コードである。各漢字には4桁あるいは5桁の16進数が付けられており、稿では、N+xxxxあるいはN+xxxxxで示すことにする。 1万3285字の内訳は、JIS X 0213の第一・第二・第三・第四水準漢字および「仝」の1万51字、JIS X 0212の漢字のうちUCS(Universal Multiple-Octet Coded

    第4回 入国管理局正字
  • 1