タグ

unicodeに関するcyokodogのブックマーク (3)

  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • ブラウザでさくさく確認できる、Unicodeの一覧表

    ブラウザでさくさく確認できる、Unicodeの一覧表「Unicode table for you」を紹介します。

  • OracleをShift JISからUTF-8/UTF-16へ移行する時の問題点 - tanamonの稀に良く書く日記

    今JA16SJISTILDE(Shift JIS)で運用しているDBをAL32UTF8(UTF-8)かAL16UTF16(UTF-16)に変更しようという話が出てきているので、何が問題になりそうかメモしてみる。 きっと他にもあるので後で追記する。 格納データ量が増える 1.5倍〜2倍程度には増える。 これはしかたない。 CHAR/VARCHARに格納できる文字数が減る 文字列型の格納方法をバイト単位(バイト・セマンティクス)から文字数単位(キャラクタ・セマンティクス)にすれば、むしろ格納文字数は増える。しかし、アプリのバリデーションがアホだと来ORAエラーにより水際で防いでいた部分も格納されるようになるため、データ連係時に問題が出そう。 バイト数から描画エリアを判断できなくなる 例えば等幅フォントで全角50文字しか入らないエリアがあるとすると、そこに収めるための処理はアプリが実装すること

    OracleをShift JISからUTF-8/UTF-16へ移行する時の問題点 - tanamonの稀に良く書く日記
  • 1