タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

文字コードに関するnohzakiのブックマーク (2)

  • 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。

    「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ

    文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。
    nohzaki
    nohzaki 2010/07/12
    文字コードのまとめ
  • 文字コードの解析、変換(エンコード、デコード) / SEO、セキュリティ、調査ツール

    文字コードの変換や解析を行います。 文字化けを起こしたメッセージを読みたいときなどに効果があります。 文字種によってはHTMLで表記できない場合や、このページソースで取得しないといけない場合など、正しく変換できない場合があります。 デコードの場合、変換前文字種を指定し、変換後文字種は通常「sjis」を指定する。 エンコードの場合、変換前文字種「なし」で変換後文字種を指定する。 正しく変換されない場合のみ、変換前文字種を変更する。 デコードの場合、最大入力文字数は 1000 字です。 ただしエンコードの場合の最大入力文字数は 80 字です。 よく使われる文字コードの特徴を説明しておきます。 【デコード時の設定方法】 jisコード→「�$B$"$$$&$($*�(B」 →変換前文字種:「jis」 →変換後文字種:「sjis」 eucコード→「、「、、、ヲ、ィ、ェ」 →変換前文字種:「euc-j

    nohzaki
    nohzaki 2009/12/25
    違う文字コードに変換してくれます。
  • 1