タグ

Unicodeに関するU40のブックマーク (5)

  • @IT:Javaの文字化け対策FAQ(3)

    JSP/サーブレット・プログラミングで誰もが一度は遭遇するトラブルが文字化けだ。予期せぬ文字化け発生に、デバックに苦労した経験を持つ読者も多いだろう。連載では、JSP/サーブレットにおける文字列の扱いの基礎を復習した上で、文字化けの解決策を要点よく解説していく予定だ。(編集部) 質問1:ファイルやメール、DBで「~∥‐¢£¬」が文字化けします 解答: 各種文字コードとUnicodeの間の変換ルールを見直しましょう 前回説明したとおり、「~∥‐¢£¬」の文字化けは、「Unicodeと各種文字コード間の変換ルールの違い」によって発生するものだ。これらの文字について、Windows-31JとUnicode間の変換ルールは、その他の文字コード(Shift_JIS、EUC_JP、ISO-2022-JPなど)に用いられる変換ルールとはまったく異なる。よって、Windows-31Jとその他の文字コード

    @IT:Javaの文字化け対策FAQ(3)
  • An Unicode vendor-specific character table for japanese (日本語のUnicodeベンダ依存文字表)

  • 文字コードについて(シフトJISの問題)

    文字コードをシフトJISで開発し、Windowsのサーバで動かす場合の文字コード問題について示します。 厳密にいうとWindowsが扱う文字コードは、シフトJISでは、ありません。MS932です。または、コードページ CP932ともいいます。MS932は、マ社がシフトJISを拡張して定義したコード体系です。 で、ここで何が問題になるかというと、クライアントへの出力をcharset="Shift_JIS"とか定義して、アプリケーションサーバーなど が一生懸命シフトJISで出力しようとすると、ある文字列が文字化けするのです。ようは、MS932にある文字コードはシフトJISには、ないので、'? 'で出力されるということです。なお、OC4JやJBuilderで利用するtomcatは、MS932で出力しようとするので、あんまり文字化けしませ ん。 Java内部で扱う文字コードは、Unicodeです。

  • 3分LifeHacking:“公式”ページを調べる方法 - ITmedia Biz.ID

    このキーワードの公式ページはどこ? GoogleのBrowse by Name検索を使えば、あるキーワードについて“Googleが決めた”公式ページをチェックすることができる。検索1位ではまだ甘い。“公式”ページを目指してみよう。 Webサイトを持っている企業やユーザーは、Googleの検索結果で少しでも上に来ることを目指しているものだろう。では、あるキーワードでGoogle検索1位になったら、それが終わりかというと、実は違う。さらに上があるのだ。 Googleは、「Googleツールバー」の機能として「日語ナビ」(欧文名:Browse by Name)を提供している。これは、入力したキーワードの“公式ページ”を直接表示する機能だ。同様のツールを提供し、公式ページとなる権利を販売している企業もあるが、Googleの場合は公式ページをGoogleがアルゴリズムで決定するところが違う。Goo

    3分LifeHacking:“公式”ページを調べる方法 - ITmedia Biz.ID
  • 従来の文字コードとUnicodeの対応に関する諸問題

    最終更新: 1998.12.20 目次 はじめに 似た文字 旧JISと新JIS ベンダー固有文字 「全角」「半角」 ASCIIとJIS X 0201ローマ文字 おわりに 余談 1. はじめに ISO/IEC 10646とUnicode(以下Unicode)は、いろいろと論議をかもしてきましたが、 すでにいろいろなところで陰に陽に使われるようになってきました。 Windows NTの内部コードがUnicodeであるのはよく知られています。 BeOSでは、内部だけでなく全面的にUnicodeが使われています。 また、Javaのchar型もUnicodeです。 しかし、とくに入出力においては、当分は従来の文字コードと共存することになります。 すなわち、意識するしないに関わらず、Unicodeと従来コードの変換が頻繁に行われます。 変換といっても、Unicodeコンソーシアムが提供しているテーブル

  • 1