Ruby による日本語文字コード判別ライブラリの比較 してみた。いいづからぐのネタです :-) そもそも nkf の utf-8対応版が出た。 簡単に NKFモジュールに対応出来るんじゃ む。nkf自体には文字コード判別のルーチンって独立してないんだ NKF.guess って nkfとは関係ないルーチンじゃん 現状の判別ライブラリたち NKF.guess(rb_nkf_guess) もともとの NKFモジュールの実装。 関数のコメント。 /* * Character code detection - Algorithm described in: * Ken Lunde. `Understanding Japanese Information Processing' * Sebastopol, CA: O'Reilly & Associates. */ 最大の問題点は、EUC,SJIS,J