タグ

unicodeに関するRanTairyuのブックマーク (4)

  • Unicode(UTF-8)への各種メールソフト対応調査

    Unicode(UTF-8)で書かれたメールを受信した際に、各種メールソフトがどの程度、NEC特殊文字(丸の中に数字が入っているものや、「(株)」の一文字版など))やNEC選定IBM拡張文字(はしご高・や、SMAPの草剛の「」など。)、ハングル文字の表示への対応をまとめてみました。 メール送信用に利用したのはOutlook Express6.0(WindowsXP)でした。また、これはあくまでもUnicode(UTF-8)でのテキストメール(HTMLメールではありません。)の受信テストです。「①」「㈱」などのNEC特殊文字、「髙」「德」「彅」などのNEC選定IBM拡張文字がUTF-8のメールの場合、Macでどのように表示されるのかをテストしてみました。また、合わせて多言語文字コードであるUnicodeの力を見るため、ハングル文字の受信テストも行いました。 (Unicodeだからこそ可能かも

  • VistaでUnicode以外の選択肢はなかったのか?──京大の安岡助教授が語る

    「『JIS X 0213』の基的な考えは,必要な漢字を使いたくても使えなくて困っている人たちを助けることだった」。こう語るのは,京都大学人文科学研究所附属漢字情報研究センター助教授の安岡孝一氏。1997年以来JISの委員としてJIS規格の文字コード(「JIS X 0213」や「JIS X 0213:2004」など)の策定にかかわってきた安岡氏に,最近の文字コードの変遷や,Windows VistaにおけるJIS X 0213対応に関する見解を聞いた。 ──JIS X 0213の概要や,それが2004年に改訂された経緯などを教えてほしい。 安岡氏:過去に使われていた文字集合「JIS X 0208」や「JIS X 0212」には,日の地名で使われている文字が抜けているなど,重要な文字の不足がありました。ただしこの問題は,そこに住む地元の人は困っていても,日全体で見るとほとんどの人が困って

    VistaでUnicode以外の選択肢はなかったのか?──京大の安岡助教授が語る
  • Javascriptで数値文字参照の値を求める方法

    具体的なJavascriptのコードは、このページのHTMLソースを見ていただいければ分かりますが、charCodeAtメソッドを用います。HTMLのヘッダー部分に、左のようにConvertという自作関数を定義しています。意外と簡単な仕組みになっています。 Javascriptの関数定義の部分は、左のテキストボックスの中に記したコードのようになります。参考にしてください。 もう一つの方法は、特定文字のUnicode(ユニコード)値(16進数)を10進数表記にすることです。Unicode値は、WindowsのIME 2002なら「ツール→IMEパッド→文字一覧」を選びます。そこで、左端の「シフト JIS」という文字の横の三角印をクリックして「unicode」を選択します。これで、Unicodeの文字一覧が表示されます。 上の例のように、「考」という漢字は、unicodeは「0x8003」(「

  • Unicode 5.0:言語の分裂に挑み続けるUnicodeの新バージョン | OSDN Magazine

    Unicode Consortiumの究極的な目的は、人間界で用いられているすべての言語をコンピュータ上で再現するための標準を定めることだ。こうした目的を完全に達成するのはしばらく先のことになりそうだが、およそ3年をかけた作業の成果としてリリースされるUnicodeバージョン5.0の登場は、目標達成に向けて更なる一歩を前進させることになるだろう。こう説明するのは、同標準の創設者の1人でありUnicode委員会の代表を務めるMark Davis氏である。最終的な公開日が至近に迫った先日、Davis氏は多忙な中時間を割き、Unicodeの開発過程と克服すべき課題について語ってくれた。 Unicodeによるエンコードは、キャラクタとそのプロパティおよび文書による説明という3つの要素で構成されていると、Davis氏は説明する。ただし誤解されがちだが、ここで言うキャラクタとは特定のフォントセット内で

    Unicode 5.0:言語の分裂に挑み続けるUnicodeの新バージョン | OSDN Magazine
  • 1