タグ

postgreSQLとencodingに関するniseissaのブックマーク (2)

  • 文字セットサポート

    全てのAPIが上の一覧表に示した文字セットをサポートしているわけではありません。 例えばPostgreSQL JDBCドライバはMULE_INTERNAL、LATIN6、LATIN8、そしてLATIN10をサポートしません。 SQL_ASCIIの設定は、他の設定とかなり異なります。サーバのキャラクタセットがSQL_ASCIIのとき、サーバは0から127のバイト値をASCIIに変換します。一方、128から255までは変換されません。 設定がSQL_ASCIIの場合は、符号化は実行されません。よって、この設定は特定の符号化を使用している場合には、その符号化を無視するようになってしまいます。 多くの場合、ASCIIではない環境で作業する場合はSQL_ASCIIの設定を使用するのは、賢いことではありません。なぜならPostgreSQLはASCIIではない文字を変換したり検査したりすることは出来ない

  • EUC-JPなJava Webアプリの文字化けまとめ - ooharakの日記

    問題1 PostgreSQLのデータベースをJDBC経由でEUC_JPとして運用しているとき、古いバージョン(8.1系:〜8.1.3, 7.4: 〜7.4.12)から、それ以降のバージョンにバージョンアップしたら、character 0xXXXXXX of encoding "UNICODE" has no equivalent in "EUC_JP"というSQLExceptionが出るようになる。 原因 PostgreSQLのJDBCドライバでは、JavaからEUC_JPへの変換については、PostgreSQL上の変換ルーチンを用いる。Java上の全ての文字に対応するEUC_JP(厳密にはx-eucjp-open-19970715-ms)のコードがあるわけではないので、変換に失敗する場合がある。たとえば、置換文字(U+FFFD)は、対応するEUC_JPのコードを持たない。 このとき、Po

    EUC-JPなJava Webアプリの文字化けまとめ - ooharakの日記
  • 1