[B! i18n] mfunakiのブックマーク

Java 暗号化拡張機能 JDK5.0

Java Is the Language of Possibilities Java is powering the innovation behind our digital world. Harness this potential with Java resources for student coders, hobbyists, developers, and IT leaders.

mfunaki 2006/11/13

Java
i18n

リンク

Last update: 2014/08/09 (c)2000-2003,2007,2013-2014 seclan. All rights reserved. Homepage: http://seclan.dll.jp/ E-mail: seclan[ここはアトマークに置き換えてください]dll.jp Q. UTF って何？ Unicode (または UCS) Transf ormation Format の略語です。今のところ、UTF-1, UTF-2, UTF-5, UTF-6, UTF-7, UTF-8, UTF-9, UTF-16, UTF-17, UTF-18, UTF-32 があります。しかし、実際使用されているのは、UTF-8, UTF-16, UTF-32 です。 Q. UCS って何？ Universal Character Set の略語です。ISO 10646 の文

mfunaki 2005/11/18

リンク

■日本語の表現(2)■

多バイト方式さて、前文書で２バイト系の日本語コードについて見て来たのだが、結局、アルファベットの大文字・小文字・１バイト系カタカナ・日本語を全て丸くおさめて、統一的に扱うことのできる体系はシフトＪＩＳのみであった。つまり、２バイト(16bit)系のシステムにおいては、シフトＪＩＳが最も優秀なコードということになる。しかし、実は以前から一部のワープロ専用機などでは、３バイトの日本語コードが使用されていた。これは先頭１バイトで文字の種別を指定し、残りの２バイトに実際のコードを入れる。この方法を使うと、シフトＪＩＳでサポートしている字種に加えて、１バイト系ひらがななども問題なく使用できる。実は似たようなことをしているのが、新ＥＵＣである。新ＥＵＣ EUC(Extended Unix Code) は UNIXの世界で日本語を扱うために1985年に定められたコード表現体系である。この EUC

mfunaki 2005/11/18

リンク

■UTFとは何か■

最近unicodeに対応したソフトが増加してくるにつれ、用語の混乱も一部には見られるようになってきました。そこで特に触れることの多い、UTF-7,UTF-8,UTF-16 についてここで少し取り上げておきたいと思います。 UnicodeとUCS UnicodeはThe Unicode Consortiumが定めた文字コードの規格である。UCSはISOとIECが共同で制定したもので、ISO/IEC 10646 の規格番号が付いている。両者は大雑把にいえば同じものと考えてもよいのだが、違う機関が定めたものである故に、微妙に(?)差があるのも事実である。 ■Unicode側の改訂経緯 Unicode1.0(1991) アメリカの技術者を中心に作られ、漢字コードは極めてデタラメ Unicode1.1(1993) 中国の技術者が加わり、少しはまともになる。日本が猛反発。 Unicode2.0(199

mfunaki 2005/11/18

リンク

UNICODE のサロゲート - seclan のほえほえルーム

mfunaki 2005/11/18

リンク

はてなブックマーク

タグ

関連タグで絞り込む (3)

i18nに関するmfunakiのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス