タグ

windows vistaと文字コードに関するpotappoのブックマーク (6)

  • JIS X 0213:2004(JIS2004) で本当に文字化けする文字

    とします。Perl で文字コードを操作する方法は、Encode.pm と旧Jcode.pm (0.8系)がメジャーどころなので、その2つについて調査しました。Encode.pm に関しては、Encode::JP と Encode::JIS2K を対象としました。 まず結論から。Encode::JIS2K を使う限り、文字化けする SJIS コードは以下の35文字です。 JIS2004 で追加された10文字:879F 889E 9873 989E EAA5 EFF8 EFF9 EFFA EFFB EFFC カ行に半濁音(゜)を付けた文字など一部の文字: 82f5 82f6 82f7 82f8 82f9 8397 8398 8399 839a 839b 839c 839d 839e 83f6 8663 8667 8668 8669 866a 866b 866c 866d 866e 8685 8

    potappo
    potappo 2007/12/30
    「SJIS - EUC - UTF8 を相互変換する過程において元の文字コードに戻したときに元のコードに戻ってこない文字」について検証した記事。Encode::JIS2K というモジュールがある。
  • Vistaで化ける字,化けない字(続報)

    前報で述べた通り,マイクロソフトのWindows Vistaでは,文字コードにUnicodeを使いながら,Unicodeとは異なる文字コード規格のJIS X 0213をサポートする,という方式を取っている。というのも,Windows 98日語版以降ずっとサポートしてきたCP932(名はWindows Codepage 932,いわゆるMS 漢字コード)やJIS X 0212を捨てるわけにはいかないので,CP932もJIS X 0212もJIS X 0213もみんなまとめてUnicodeで扱う,というやり方を取らざるをえないのである。 前報では,JIS X 0213の第一水準~第三水準漢字7614字について,Vistaで新たに採用された日フォントセットであるメイリオとXP以前のMSゴシックを見比べ,7614字のうち325字*が,VistaとXP以前との間で文字化けする(ここでは来表

    Vistaで化ける字,化けない字(続報)
    potappo
    potappo 2007/12/30
    字形が化ける文字について検証した記事。第四水準漢字2436字と非漢字1183字。
  • Vistaで化ける字,化けない字

    11月30日に企業向けには出荷が始まったWindows Vista。そのVistaで,“文字化け”が起こるらしい。文字化けといっても,Webアクセス中にたまに見かける全く読めない文字の羅列になることはほとんどなく,その多くは似た文字が表示される程度である。ここでは,来表示されるべき文字の形が少し違ったものが表示されるケースも“文字化け”として扱う。 Microsoftは,Windows 98日語版の発売以来,Windows 2000,Windows Me,Windows XPまでCP932(名はWindows Codepage 932,いわゆるMS漢字コード)とJIS X 0212をサポートしてきたが,最新のWindows VistaではJIS X 0213に乗り換えた。いや,乗り換えたというのは,ちょっと語弊がある。CP932とJIS X 0212に加えて,JIS X 0213もサ

    Vistaで化ける字,化けない字
    potappo
    potappo 2007/12/30
    字形が化ける漢字がどれだけあるか検証した記事。
  • マイクロソフト、Windows XP対応のJIS2004互換フォント

    マイクロソフト株式会社は、Windows XP/Server 2003に対応したJIS2004互換フォントパッケージを提供開始した。 パッケージに含まれるフォントは「MS明朝」と「MSゴシック」の2種類。Windows Vistaでは、新JIS漢字(JIS X 0213:2004、JIS2004)を搭載しているため、Vistaで作成した文書などで使用される一部の文字が、XPやServer 2003上(JIS90)では表示が異なる現象が発生する。 同パッケージをインストールすれば、XPまたはServer 2003上のフォント環境を、Vistaのフォント環境に揃えられ、同一の文字を表示できるようになる。 また、Vistaに対応したJIS互換フォントのパッケージも同時に提供開始した。上記とは逆に、Vista上でXP/Server 2003のフォント環境(JIS90)を再現できるようになり、XP/

    potappo
    potappo 2007/02/10
    Vistaに対応したJIS互換フォントのパッケージも同時に提供開始。
  • 特番 Windows Vistaの新文字セットが引き起こすトラブル:ITpro

    【記者の眼】 Unicodeは「使える」から「知らずに使う」フェーズへ  Windowsにおいて「Unicode」は,長らく「使える」けれども「あまり使われない」存在だった。その状況が「Windows Vista」と「the 2007 Microsoft Office」で変わろうとしている。この2製品に付属する「Microsoft IME」で,「WindowsではUnicodeでしか扱えない文字」が,変換候補として頻出するようになったからだ。Unicodeはいよいよ,一般ユーザーが「知らずに使う」存在になるだろう。 【記者のつぶやき】 シフトJISを捨てられるか? これまで,Windows Vistaの文字の扱いに関する事柄を何度か取り上げてきた。同じキャラクタ・コードで,Windows XPのときと文字の形が変わったり,Unicodeでしか扱えない文字があったりするという話題だ。今

  • Windows Vistaの登場で顕在化する問題 - Cafe Babe

    C#言語のJIS改訂作業の委員会に出ていて,もうすぐWindows Vistaがリリースされるために現在各社で懸命に検証作業をおこなっているが,その中で見つかったという興味深い問題の話を某氏に聞いた.なお,私自身はまだ使っていないので,伝聞の話として読んでほしいし,間違いがあれば指摘して欲しい. Windows VistaがJIS X 0213に対応することは,みなさん聞いているかもしれない.これは一体どういうことかというと,使う側から見たらより多くの文字を表示できるようになるだけでなく,仮名漢字変換の段階で,それらの文字を含んだ候補が提示されるということだ.また,開発者の側から見ると,プログラム内部でEUC符号化やシフトJIS符号化で扱うことができなくなるのでUnicodeとして扱えるように移行していくだろうこと,そしてUnicodeを採用したシステムであっても,仕様に忠実な文字の扱い…

    Windows Vistaの登場で顕在化する問題 - Cafe Babe
  • 1