タグ

2023年11月2日のブックマーク (3件)

  • ビルマ語(ミャンマー語)のUNICODEはUNICODEじゃなかった? | エヤワディ Blog

    2011/12/09IT, ビルマ語(ミャンマー語), ミャンマー絡み 以前ビルマ語(ミャンマー語)についてブログに書いたのは2009年2月の「ビルマ語をWindowsで~Unicode以前」だった。その後すぐに続編を書く予定だったのが、結局今日になってしまった。3年越しの恋ならぬ、3年越しの ユニコードだ。 Unicode(ユニコード)とは、コンピュータで文字を扱うための世界標準の規格だ。Unicodeにはビルマ語も含めて世界中の文字が規定されている。このおかげで、コンピュータで簡単に世界各国の文字を見たり書いたりすることができる。ちなみに、ビルマ語はUnicodeの1000番~109F番とAA60番~AA7B番までのエリアを割り当てられている。ちょうど1000番で覚えやすいが、1000といっても16進の1000だから10進で数えると4096番目だ。 Unicodeの1000番〜109F

    ビルマ語(ミャンマー語)のUNICODEはUNICODEじゃなかった? | エヤワディ Blog
  • ビルマ語(ミャンマー語)をWindowsで~Unicode以前 | エヤワディ Blog

    2009/02/27IT, ビルマ語(ミャンマー語), ミャンマー絡み ユニコード(Unicode)とビルマ語の話を書こうと思ったら、Unicode以前の話も書かないとわかりづらいということで、前半と後半に分けることにした。前半は、Unicode以前、後半はUnicodeの話だ。もしかしたら私の無知や勘違いがあるかもしれないので、間違いがあったらご指摘を。 Windows95や98の時代は日Windowsでビルマ語を表記するのは大変だった。特に2階建て文字のような特殊文字を表示するのが難しかった。当時、文字は1バイト(8ビット)容量の中で扱われていた。8ビットだから256種類だ。256種のうち、前半はアスキー(ASCII)文字と言われる標準的なアルファべトと記号の範囲で、後半は各言語の独自の規格の部分になった。タイ語やアラビア語、日語の半角カタカナなどがこの後半部に入れられた。なお、

    ビルマ語(ミャンマー語)をWindowsで~Unicode以前 | エヤワディ Blog
  • GB18030-2022が来た!詳細編—内容から読み取る本質〈エリックの多言語文字散歩〉|ヒラギノフォント公式note

    前回の概要編では、じっくりとGB18030-2022の表紙を見ながら、中国におけるGBの定義、GB18030規格改定の概要、製品への搭載義務などについて解説しました。今回は、いよいよ表紙をめくって更新された内容について詳しく解説していきます。 漢字はとにかく多いGB18030-2022の規格書の実物を見ると、まずその厚みに圧倒されるでしょう。700ページを超えるページをパラパラとめくってみてわかるのは、文はわずか8ページ程度で、残りのほとんどは付属書である長い文字コード表ばかりです。 文字コードの国際標準としてISO/IEC 10646があります。そして業界規格のUnicodeとおおむね互換しています。一方でGB18030は中国独自の規格です。GB18030は策定当初から国際標準の存在を意識して設計され、膨大な量のコードポイント(符号位置)と、各文字コードを相互変換するための対応表を用意

    GB18030-2022が来た!詳細編—内容から読み取る本質〈エリックの多言語文字散歩〉|ヒラギノフォント公式note