タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

文字コードに関するmessiquoのブックマーク (6)

  • アポストロフィの悩み | Okumura's Blog

    何でもいいから英語の単語に「痴」を付けてGoogleで検索してみる。例えば「he痴」でもいい。うまく見つからなければ,例えば Shakespeare痴 Got A Gun を見てみる。英語のサイトなのに何でこう「痴」が多いのか(うまく「痴」に見えないなら,ブラウザのデフォルトのエンコーディングをシフトJISにしてみてください)。 答え:Windows-1252(CP1252)のアポストロフィは 0x92 であり,これにs(0x73)が付くと 92 73 となり,これはシフトJISで「痴」になる。つまり,「He's」が「He痴」に化けるページはアポストロフィをWindows-1252でエンコーディングし,エンコーディング指定をしていないのでシフトJISで表示してしまったのである。書いた人はLatin-1(ISO 8859-1)のつもりかもしれない。 アポストロフィは '(0x27)でいいの

    messiquo
    messiquo 2009/08/27
    アポストロフィーには'(U+0027)より’(U+2019) が望ましいが、現状では全角表示になってしまう。特に英文上級者の英文中に平気で全角が突っ込まれているのが不思議だったが、それでか。今まであまりに無頓着だったかも。
  • Vista で導入される JIS X 0213:2004(JIS2004) のまとめ(お勉強編)

    「日語文字セットがVista最大の問題として急浮上:ITpro」 が初めのネタになったのですが、なかなか時間もとれず、この記事を書き始めてはや3週間も経ってしまいました・・・orz Windows Vistaは、新しい文字セットに関するJIS規格「JIS X 0213:2004」に準拠した日フォントを標準で搭載する。これにより、既存の漢字のうち122文字の字形が変更になり、約900文字の漢字、約200文字の非漢字(英語の発音記号や記号、アイヌ文字など)が新たに表示可能になる。 〜中略〜 さらに、追加される新しい文字の一部をUnicodeで表現すると、通常の2バイトではなく4バイトで表現されるものがある。 をみて、SJIS → UTF-8 → SJIS とかやると文字化けするものとかでるじゃん!大丈夫だっけ?大丈夫じゃなかったら、どんな対策をとったらいいんだっけ?ってのを考察しています

  • Windows Vistaの文字セット問題 | スラド

    勝手に「文字化け」の意味を拡大解釈した上でタイトルとして使うのはどうなのかと。この記事は XP と Vista では字形が変わるという問題だけ言っていてソリューションを一切説明していない辺りが微妙すぎます。 わざとなのか知らないのかは知りませんが (おそらく後者)、Vista で採用されている MS 明朝/ゴシック 3.2 は XP や Server 2003 にも提供されます。このため、XP 環境でも Vista と同じ字形での表示は可能となります。 さらに移行期間中の措置として、XP で採用されている MS 明朝/ゴシック 2.5 を Vista や Longhorn Server へ提供することも決まっています。このため、ソフトウェア側が対応していなくても Vista 側でも JIS90 を普通に表示することが可能です。 また、OpenType Feature Tag を利用して J

    messiquo
    messiquo 2006/12/26
    後で読もうと思ってるけど…。「化ける」は誤解を招くね。
  • IE7にオンライン・ストレージやWebメールで日本語ファイル名が化ける不具合

    画面1 オンライン・ストレージ・サービスで「対象をファイルに保存」を実行して表れるダイアログで「予算.txt」が文字化けしたところ マイクロソフトが提供するInternet Explorer 7(IE7)に,日語ファイル名が化ける不具合があることが明らかになった。オンライン・ストレージ系サービスでファイルをダウンロードするときやWebメールで添付ファイルをダウンロードするときなどに発生する。文字化けするのは,特定のルールに当てはまる複数の文字で,例えば「予算.txt」というファイル名が「誉算.txt」になる。マイクロソフトによると,Windows XP Service Pack 2版およびVista版の両方のIE7で発生する。 Windows XP SP2版IE7で,四つのオンライン・ストレージ系サービスで試したところ,「Yahoo!ブリーフケース」「デジタルトランクサービス」「Inte

    IE7にオンライン・ストレージやWebメールで日本語ファイル名が化ける不具合
    messiquo
    messiquo 2006/12/05
    2バイト目のバックスラやパイプが問題になってるのはわかるけど、なんでIE7だけ? アプリケーションの問題ならともかく、機序がよくわからん。
  • 文字コードの発展経緯から役割と仕組みを学ぶ

    コンピュータを使っていると,画面上でさまざまな文字を目にすると思うが,これはすべて文字コードという考え方に基づいて表示している。ただ,コンピュータの内部と通信用で違う種類の文字コードを使い分けるケースも多く,なにかと複雑。これが原因で文字化けもしょっちゅう起こる。そこで,文字コードの世界を探ってみることにしよう。なお,この記事は日経NETWORK 2002年2月号に掲載したものです。それ以降の情報が盛り込まれていませんので,現在とは異なる場合があります。文字コード規格の基礎を手早く理解したい場合などにお役立てください。 インターネット上でやりとりされるデータは,すべて0か1のビットの列で表す。画像だろうと音楽だろうと,ビット列であることに変わりはない。文字だって同じである。 このため,ある文字をどのようなビット列に置き換えるのかということを,あらかじめ決めておく必要がある(図1)。具体的に

    文字コードの発展経緯から役割と仕組みを学ぶ
    messiquo
    messiquo 2006/11/24
    参考になるんだけど、「コード表を切り替えるというJISの設計思想」には少し違和感。あと、出典が古い(日経ネットワーク 2002年2月号) 事が分かりづらいのでは?
  • 日本語文字セットがVista最大の問題として急浮上

    「どこでどういった問題が起こるのか分からない。まさかデータベースが壊れるということはないと思うが」――。国内大手ベンダーの幹部は不安そうに話す。この幹部が懸念するのは、Windows Vistaで採用された新文字セットの情報システムへの影響である。別の大手ベンダーのシステム構築部門も、「情報システムのクライアントとしてVistaを見た場合、最大の問題は日語の文字セットだ。現在、共通の基盤技術セクションで影響を調査している」という。 企業向けVistaの出荷開始を目前に控え、Vistaの新文字セット採用が大きな問題として浮上してきた。 Windows Vistaは、新しい文字セットに関するJIS規格「JIS X 0213:2004」に準拠した日フォントを標準で搭載する。これにより、既存の漢字のうち122文字の字形が変更になり、約900文字の漢字、約200文字の非漢字(英語の発音記号や記

    日本語文字セットがVista最大の問題として急浮上
    messiquo
    messiquo 2006/11/24
    VistaではJIS X 0213:2004に対応するため、ユーザーが知らずに新しい文字を入力することが考えられる。4バイトになるときが特に問題。
  • 1