[B! unicode][decode] suisuina0823のブックマーク

suisuina0823 id:suisuina0823

unicodeとdecodeに関するsuisuina0823のブックマーク (1)

日本語文字コードの判別 - Linux関連 - 博客频道 - CSDN.NET
1.最初に昔から言われていることなのですが日本語の文字コード判別は非常に難しいですそれの原因のひとつにSJIS・EUCにおける半角カナが互いのコード領域に完全に被っているためですそのためインターネットの掲示板などでは半角カナを使うことはある意味ルール違反だったりしますでも実際のところは２ちゃんねるとかは半角カナであふれているわけですが・・・では半角カナにさせつつ文字コードを判別するにはどうすればいいでしょうか？今回はISO-2022-JP(JIS) SJIS(SHIFT_JIS) EUC UTF-8 UTF-8Nでの判別について解説します実際の活用例はこちら(文字コード判別・変換クラス)へ 2.ISO-2022-JPの解説いわゆるエスケープシーケンス(以下ESC)を利用して使う文字コードを変えていく形式ですそのため漢字やひらがなを使うたびにESCが発生します ESCは最
suisuina0823 2013/04/09
unicode

decode

String
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx