タグ

ブックマーク / pub.cozmixng.org/~the-rwiki (1)

  • たむら::日本語文字コードの自動判定

    Ruby による日語文字コード判別ライブラリの比較 してみた。いいづからぐのネタです :-) そもそも nkf の utf-8対応版が出た。 簡単に NKFモジュールに対応出来るんじゃ む。nkf自体には文字コード判別のルーチンって独立してないんだ NKF.guess って nkfとは関係ないルーチンじゃん 現状の判別ライブラリたち NKF.guess(rb_nkf_guess) もともとの NKFモジュールの実装。 関数のコメント。 /* * Character code detection - Algorithm described in: * Ken Lunde. `Understanding Japanese Information Processing' * Sebastopol, CA: O'Reilly & Associates. */ 最大の問題点は、EUC,SJIS,J

    Cherenkov
    Cherenkov 2010/11/29
    マルチバイト文字 全角 判定 日本語
  • 1