タグ

Unicodeに関するPerfektweltのブックマーク (7)

  • http://www.macchiato.com/unicode/chart/

    Perfektwelt
    Perfektwelt 2008/04/16
    Unicodeのコードポイントを検索
  • 波ダッシュ・全角チルダ問題 - Wikipedia

    Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界標準規格。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 従来、各国の標準化団体あるいは各コンピュータメーカーによって独自に開発されていた個々の文字コードの間には互換性がなかった[1]。ISO/IEC 2022のように複数の文字コードを共存させる方法も考案されたが、例えば日語の漢字と中国語の漢字のように、文字が重複する短所がある。一方Unicodeは、微細な差異はあっても質的に同じ文字であれば一つの番号を当てる方針で各国・各社の文字コードの統合を図った規格である[1]。1980年代に、Starワークステーションの日語化(J-Star)などを行ったゼロックスが提唱し、マイクロソフト、Apple、IBM、サン・マイクロシステムズ、ヒ

    波ダッシュ・全角チルダ問題 - Wikipedia
  • JIS X 0213のコード対応表

    JIS X 0213とUnicodeの対応表 JIS X 0213の符号化方式とUnicode (ISO/IEC 10646 UCS)との対応表 (変換表) です。 機械可読なタブ区切りテキスト形式です。 自由に使用・配布・改変等していただけます。 Shift_JIS-2004とUnicodeの対応表 文字付き版: Shift_JIS-2004 / UTF-8 EUC-JIS-2004とUnicodeの対応表 文字付き版: EUC-JIS-2004 / UTF-8 ISO-2022-JP-2004とUnicodeの対応表 JIS X 0213:2004 漢字7ビット符号とUnicodeの対応表 JIS X 0213:2004 漢字8ビット符号とUnicodeの対応表 これらの表は、「JIS-UCS 変換表」にあるJIS X 0213:2000ベースの変換表を元にして、2004年改正を反映さ

  • ISO/IEC 10646 - Wikipedia

    この規格は制定の一歩手前の段階までは、現在の姿とはかなり異なる仕様だった。4オクテットの符号であり、各オクテットをそれぞれ群、面、区、点とする。各面には従来のコントロール領域を避けた0x20 - 0x7Fと0xA0 - 0xFFの範囲に文字を割り当てる。その範囲にISO/IEC 2022に従った構造の各国コード(ISO/IEC 8859やJIS X 0208、GB 2312など)を平行移動してそっくり収容するという、従来のコード系との互換性を最大限に尊重した構成をとっていた。 この案は1990年に国際標準の一歩前の段階のDIS (Draft International Standard) として作成されたが、1991年6月の投票で否決された。その理由は、同じ時期にアメリカの企業群がUnicode仕様を作成したため、同じ目的の規格が2つ作られることを避けることだった。 その後、DIS 106

  • UCS と Unicode

    UCS ( Universal Multiple-Octet Coded Character Set ) は全ての言語の 文字を一つの ( 統一された ) コードに割り当てるものです。 コードテーブルは 0 〜 0x7FFFFFFF と、約21億文字分 有ります。 1文字あたり4バイト使用するため UCS-4 とも呼ばれます。 Unicode は UCS の 0 〜 0x10FFFF ( 約 111 万文字 ) の部分をいいます。 使います、と書きましたが実際は UCS と Unicode は策定しているグループが異なります。 UCS を策定しているグループが下位部分を採用したことから互換性が発生し、 サブセット(部分集合)レベルでは同一とみなせるのが現状です。 UCS-4 の範囲では UCS-4 ( UTF-32 とも呼ばれます ) と UTF-8 の2種類のコーディ

  • Index

    Automatic redirect: http://home.unicode.org/

  • ■UTFとは何か■

    最近unicodeに対応したソフトが増加してくるにつれ、用語の混乱も一部には見られるようになってきました。そこで特に触れることの多い、UTF-7,UTF-8,UTF-16 についてここで少し取り上げておきたいと思います。 UnicodeとUCS UnicodeはThe Unicode Consortiumが定めた文字コードの規格である。UCSはISOとIECが共同で制定したもので、ISO/IEC 10646 の規格番号が付いている。両者は大雑把にいえば同じものと考えてもよいのだが、違う機関が定めたものである故に、微妙に(?)差があるのも事実である。 ■Unicode側の改訂経緯 Unicode1.0(1991) アメリカ技術者を中心に作られ、漢字コードは極めてデタラメ Unicode1.1(1993) 中国技術者が加わり、少しはまともになる。日が猛反発。 Unicode2.0(199

  • 1