タグ

ブックマーク / hhelibex.hatenablog.jp (2)

  • JavaプログラムからMySQLに4バイトのUTF-8文字を放り込んでみる - HHeLiBeXの日記 正道編

    前の記事で、PHPプログラムからMySQLに4バイトのUTF-8文字を放り込んでみた。 MySQLで4バイトのUTF-8文字を扱ってみる - HHeLiBeXの日記 正道編 ついでなので、Javaプログラムの場合はどうなるのかを調べてみた。 例のごとく、「𠮟」と書かれた部分は「叱」の異体字だと思って読んでもらえればと。 面倒なので、プログラム自体は割愛するが(待て)、以下のSQL文を順に発行するだけの単純なプログラム。特にMySQLに特化したパラメータを渡すことはしていない。(便宜上、SQL文の末尾にセミコロンをつけている) DELETE FROM hoge; -- 従来から定義されている文字 INSERT INTO hoge(idx, str) VALUES(0, '叱'); -- JIS X 0213:2004 で追加された、UTF-8で4バイトになる文字 INSERT INTO h

    JavaプログラムからMySQLに4バイトのUTF-8文字を放り込んでみる - HHeLiBeXの日記 正道編
    nilab
    nilab 2014/12/22
    JavaプログラムからMySQLに4バイトのUTF-8文字を放り込んでみる - HHeLiBeXの日記 正道編 : utf8mb4 : 5.5.3 以降で utf8mb4 を指定。MySQL の JDBC ドライバ (Connector/J) は v5.1.13 以降を使用
  • MySQLで4バイトのUTF-8文字を扱ってみる - HHeLiBeXの日記 正道編

    JIS X 0213:2004で追加された「叱」の異体字は、Unicodeにおいては「UTF-8で符号化すると4バイトになる」コードが割り当てられている。また、中国語をまともに扱おうと思ったら「UTF-8で4バイト」の文字を扱う必要が出てくる。 そんな文字どもをMySQLデータベースに放り込もうと、UTF-8指定でがんばっていたのだが、ひとつの結論に行き着いたらしい。 MySQLの"UTF-8"にご用心 - yanok.netUTF-8で4バイト」の文字を扱おうと思ったら、MySQL 5.5.3以降を使い、さらに"utf8mb4"を指定せよ、という冗談のような当の話。 まぁグダグダ言っても始まらないので、まずは手元にある環境で試してみるところから。 事前準備 環境として、以下のものを使用する。 OS Windows Vista Business SP2 (x86) PHP v5.3.

    MySQLで4バイトのUTF-8文字を扱ってみる - HHeLiBeXの日記 正道編
    nilab
    nilab 2013/07/24
    MySQLで4バイトのUTF-8文字を扱ってみる - HHeLiBeXの日記 正道編
  • 1