タグ

文字コードに関するjiwer5959のブックマーク (6)

  • Apple Mailにおけるテキストエンコーディングの優先順位 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    以前のエントリで以下のように書いたが、ちょっと訂正。 Apple Mail(バージョン2.1(752/752.2)で確認)は、日語環境においては、送信しようとしているメールに含まれる文字の種類によって、US-ASCII>ISO-2022-JP>CP932>UTF-8の優先順位でcharsetを決定しているようだ(CP932というcharsetはIANAに登録されていないという議論は、ここでは措く)。 表が修正版。下に行くほど優先順位が低い。上記の引用部分との違いは、SHIFT_JISが追加されている点である。 文字の範囲 Apple Mailの符号化方法 ASCII US-ASCII JIS X 0201ラテン文字集合 SHIFT_JIS MacJapanese ISO-2022-JP CP932 CP932 Unicode UTF-8 不思議な表である。「MacJapaneseの範囲の

    Apple Mailにおけるテキストエンコーディングの優先順位 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • Mac OSで圧縮したZIPファイルをWindowsで解凍すると文字化けしてしまう… | Webシステム

    Web制作現場では、サイトを公開するまでの間に様々な環境でデータのやりとりが行われます。 例えば、WebデザイナーはMac OSを使っていることが多いですが、デザインの確認担当(編集者や制作ディレクター)はWindowsを使っていることが多い。 あと、システム担当はLinuxをメインに使っていたり…。 異なる環境間でデータの受け渡しをする際に、Webデザイナーから受け取ったZIPファイルをWindowsで解凍したら文字化けしていたということがしばしば起こります…。 ファイル名が英数字のものは問題ないですが、Mac OS上で日語ファイルをZIP圧縮したものは、Windowsで解凍すると全て文字化けしてしまいます。 原因はMac OSではファイル名の文字コードにUnicode(UTF-8)を使用していて、WindowsではShift_JISを使用していることから、環境の違いによるものです。

  • 文字コード表

    ※注意 動作確認環境以外は正確に表示出来ない可能性がございますのでご了承ください。 ※動作確認環境 ( Win ) IE 6.0 / Mozilla Firefox 1.5 / Sleipnir 2.3 / Opera 9.1 使用頻度高 < &lt; 右大不等号 > &gt; 左大不等号 & &amp; アンド " &quot; ダブルクォート &nbsp; 半角スペース © &copy; コピーライト @ &#64; アットマーク ® &reg; 登録商標マーク 〒 &#12306; 郵便マーク % &#37; パーセント 日付・曜日など ㈷ &#12855; 祝日 ㈪ &#12842; 月曜 ㈬ &#12844; 水曜 ㈮ &#12846; 金曜 ㊗ &#12951; 祝日 ㊊ &#12938; 月曜 ㊌ &#12940; 水曜 ㊎ &#12942; 金曜 ㋀ &#12992; 1月

  • 複数の事象を混同しがちなVistaの文字問題

    既にいくつかの記事で報道されているように,Windows Vistaでは,JIS X 0213:2004(JIS2004)と呼ぶ規格に対応し,利用できる文字数が増えるとともに一部の文字の形が変わる。そのことで,Windows Vistaを使うと文字に関して何か問題を起こすかのように思われている節があるようだ。 私が書いた記事でも,「これらの文字を使ってWindows Vistaで作った文書を,JIS2004に対応していない既存のWindowsで開くと,『・』や『■』などで表示される恐れがある」と記述しており,読者に対して余計な不安を与えてしまったかもしれない。また,「追加文字を使った文書を保存するときは,エンコーディングをUnicodeにする必要がある」との記述は,Windows Vistaだけのことかと誤解を与えてしまったかもしれない。これは,後で説明するようにWindows 98/NT

    複数の事象を混同しがちなVistaの文字問題
  • Vista で導入される JIS X 0213:2004(JIS2004) のまとめ(お勉強編)

    「日語文字セットがVista最大の問題として急浮上:ITpro」 が初めのネタになったのですが、なかなか時間もとれず、この記事を書き始めてはや3週間も経ってしまいました・・・orz Windows Vistaは、新しい文字セットに関するJIS規格「JIS X 0213:2004」に準拠した日フォントを標準で搭載する。これにより、既存の漢字のうち122文字の字形が変更になり、約900文字の漢字、約200文字の非漢字(英語の発音記号や記号、アイヌ文字など)が新たに表示可能になる。 〜中略〜 さらに、追加される新しい文字の一部をUnicodeで表現すると、通常の2バイトではなく4バイトで表現されるものがある。 をみて、SJIS → UTF-8 → SJIS とかやると文字化けするものとかでるじゃん!大丈夫だっけ?大丈夫じゃなかったら、どんな対策をとったらいいんだっけ?ってのを考察しています

  • 新漢字則(JIS X 0213:2004)

    JIS X 0213:2004って何? コンピューターで文字を取り扱うには、文字に番号をつけて管理します(20年以上前では単なるグラフィックを描画していたものもありましたが)。通信の世界では文字を番号で送るほうが、グラフィックで送るよりはるかに少ないデータ量ですみます。はるか昔の300BPS(1秒間に300ビット、漢字換算でおおよそ1秒間に15文字の送受信)の頃に誰も文字をグラフィックで送受信しようなんて考えませんよね。それに文字を番号で管理すると、データベースへの蓄積・参照・検索が容易になります。アウトラインフォントも番号で管理しているからできるのです。アメリカで生まれたコンピューターではEBCDICやASCIIという管理方法(コード体系)が使われていました。日ではラテン系文字(いわゆるアルファベット)に比べはるかに文字数が増えます。そこでASCIIコードの各国拡張領域($80-$FF

  • 1