タグ

javaとunicodeに関するHayatoのブックマーク (3)

  • 「Java 6 でIVSを比較すると何が起こるか」の記事の誤り - Cafe Babe

    以下の記事に誤りが散見されるが,それが広まるのは望ましくないので,ここで誤りを指摘しておく. 「Java 6 でIVSを比較すると何が起こるか」(yanok.net) まず,Javaの文字列の同一性判定の話である. これは想像通りですね。単にcharの列を比較しただけの結果になっています。つまり、見た目の区別がつかなくても容赦なく別々の文字列として扱っています。これが何をもたらすかというと、Stringクラスで比較しているプログラムに対しては、"与" と "与[0E0100]" と "与[0E0102]" を、見た目の区別がないにもかかわらず、人が入力し分けてやらないと困ることになるということです。 Java言語でUnicode文字列が同一性を判定するには,いくつかの方法がある. java.lang.String#equals()…単なるUnicode文字シーケンスの同一性を判定する ja

    「Java 6 でIVSを比較すると何が起こるか」の記事の誤り - Cafe Babe
  • Java6にはUnicode正規化の機能がいるそうな : mwSoft blog

    恥ずかしながら、先月くらいに気付いたのですが、Java1.6からはSDKにUnicode正規化に関する機能が標準搭載されているようで。便利になったものですな。 java.text.Normalizerで、normalizeと書くだけで実行出来ます。 以下、サンプル。変な文字使ってるので機種によって化けるかもしれません。ご了承ください。 import java.text.Normalizer; public class Test { public static void main(String[] args) throws Exception { /****** 平仮名の「が」 ******/ // 正規分解とそれに続く正規合成 Normalizer.normalize( "が", Normalizer.Form.NFC ); // => が // 正規分解 Normalizer.norma

  • ICU - International Components for Unicode

    2026-03-17: ICU 78.3 is now available — releases/tag/release-78.3 — Maven: com.ibm.icu / icu4j / version 78.3 This is a maintenance release. It supersedes ICU 78.1 and 78.2. ICU 78 updates to Unicode 17 (blog), including new characters and scripts, emoji, collation & IDNA changes, and corresponding APIs and implementations. It also updates to CLDR 48 (blog) locale data with new locales, and variou

    Hayato
    Hayato 2009/03/29
    UNICODE正規化やエンコーディング判定など
  • 1