タグ

2006年4月23日のブックマーク (1件)

  • 文字コード判定ライブラリ Universal Encoding Detector

    Universal Encoding Detector は Mozillaのコードが移植された、文字コードを判定するライブラリです。 とりあえずの使い方はとっても簡単で文字(列)をdetect()するだけで、推定されたエンコーディングと信頼度が返ってきます。 サポートされている文字コードも文句ありません。 「あ」1文字のように入力文字列が短すぎる場合の判定は常に信頼度0.505と出てましたがエンコーディングは合っていました。実用では1文字から推定するなんて皆無なので何も心配することはないでしょう。 <  | >

    gamella
    gamella 2006/04/23
    たぶん、使うとおもうなー。