タグ

文字コードに関するlittle_jpのブックマーク (2)

  • PHPの文字コード設定についてのメモ - nokunoの日記

    PHPの文字コードの設定には次の3種類がある。バージョンはPHP5.2.6です。内部エンコーディング(internal_encoding)HTTP入力(http_input)HTTP出力(http_output)PHPで日語を扱うためにはinternal_encodingの設定は必須で、http_inputとhttp_outputは設定ファイルで自動変換を設定するか、スクリプトで変換するかを選べる(未設定で変換もしないと内部エンコーディングと同じになる?)。スクリプトで変換すると文字コードをパラメータで変更できるので、Social IMEの変換サーバーではAPIの引数として文字コードを渡せるようにしている(ただし今は出力のみ)。現在のphp.iniはこうなっている。 ;内部エンコーディングをUTF-8に設定(必須) mbstring.language = Japanese mbstrin

  • 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。

    「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ

    文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。
  • 1