タグ

encodingに関するniseissaのブックマーク (4)

  • 中国語の文字コード

    中国語の文字コードについての解説ページです。 日語の文字コードについては、文字コードについてを参照してください。中国語についてのページもあります。 中国語の文字コードの種類 中国語には、繁体字(Traditional Chinese)と、簡体字(Simplified Chinese)があります。 繁体字は香港や台湾で使われていて、簡体字は中国土やシンガポールで使われています。 簡体字は、繁体字の画数を減らし、簡単に読み書きできるように改良したものですが、文字コード体系が全く異なるため、全く互換性はありません。 繁体字中国語の文字コードは、台湾のメーカー5社が策定した「Big5」がよく使われています。 ただ、Big5は、ISO-2022準拠でないため、「CNS11643(EUC_TW)」も作られました。 CNSは、Chinese National Standardsの略です。 簡体字中国

  • 文字セットサポート

    全てのAPIが上の一覧表に示した文字セットをサポートしているわけではありません。 例えばPostgreSQL JDBCドライバはMULE_INTERNAL、LATIN6、LATIN8、そしてLATIN10をサポートしません。 SQL_ASCIIの設定は、他の設定とかなり異なります。サーバのキャラクタセットがSQL_ASCIIのとき、サーバは0から127のバイト値をASCIIに変換します。一方、128から255までは変換されません。 設定がSQL_ASCIIの場合は、符号化は実行されません。よって、この設定は特定の符号化を使用している場合には、その符号化を無視するようになってしまいます。 多くの場合、ASCIIではない環境で作業する場合はSQL_ASCIIの設定を使用するのは、賢いことではありません。なぜならPostgreSQLはASCIIではない文字を変換したり検査したりすることは出来ない

  • EUC-JPなJava Webアプリの文字化けまとめ - ooharakの日記

    問題1 PostgreSQLのデータベースをJDBC経由でEUC_JPとして運用しているとき、古いバージョン(8.1系:〜8.1.3, 7.4: 〜7.4.12)から、それ以降のバージョンにバージョンアップしたら、character 0xXXXXXX of encoding "UNICODE" has no equivalent in "EUC_JP"というSQLExceptionが出るようになる。 原因 PostgreSQLのJDBCドライバでは、JavaからEUC_JPへの変換については、PostgreSQL上の変換ルーチンを用いる。Java上の全ての文字に対応するEUC_JP(厳密にはx-eucjp-open-19970715-ms)のコードがあるわけではないので、変換に失敗する場合がある。たとえば、置換文字(U+FFFD)は、対応するEUC_JPのコードを持たない。 このとき、Po

    EUC-JPなJava Webアプリの文字化けまとめ - ooharakの日記
  • MySQL 文字化け問題を本気で直す

    mysql> status; -------------- mysql Ver 14.7 Distrib 4.1.20, for redhat-linux-gnu (i386) using readline 4.3 Connection id: 36 Current database: staff2006 Current user: maiha@localhost SSL: Not in use Current pager: lv Using outfile: '' Using delimiter: ; Server version: 4.1.20 Protocol version: 10 Connection: Localhost via UNIX socket Server characterset: latin1 Db characterset: latin1 Client char

  • 1