タグ

UNICODEに関するryomiyoのブックマーク (3)

  • IEでは、商標マーク®をサーバに送信すると®になる

    いやー今日は勉強になりました。 IE6でしか試していないのですが、商標マーク「®」など、一部のHTMLエンティティな文字列をサーバへ送信すると「®」という文字列として送信されるようです。 試しにやってみる 試しに、yahoo.co.jpでやってみます。 そして送信後 ※ IEが英語版だったりしますが、日語版でも同様になります 他のサイトでもやってみる yahoo.co.jpという大手だから何かやってるのかなーと思ってたんですが、search.yahoo.co.jpやyahoo.com、googleで「®」の文字をコピペして送ってみました。 search.yahoo.co.jpでやってみた コピペして 送信後 あれ、ポータルトップページから送信したのと結果が違う… yahoo.comでやってみる コピペして 送信後 ちゃんと「®」として表示されます google.co.jpは

  • Unicode の文字列をソースコードに埋め込む方法 - bkブログ

    Unicode の文字列をソースコードに埋め込む方法 Unicode の文字列をソースコードに埋め込む場合、直接 UTF-8 などで文字列を書く方法と、\uXXXX などのようにエスケープして表記する方法があります。後者の方法についてまとめてみました。 \uXXXX 形式の場合 Java, JavaScript, Python, C++, C (C99から) などの多くの言語では \uXXXX という表記 (universal character names) でUnicode の文字を文字列の中に埋め込めます。たとえば、「あいう」は "\u3042\u3044\u3046" となります。 \uXXXX で埋め込んだ文字がどのように解釈されるかは言語や処理系によって異なります。 gcc/g++ の場合、 -fexec-charset オプションで、実際に使う文字セット・エンコーディングを指

  • サロゲートペア入門:CodeZine

    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicode

  • 1