タグ

文字コードに関するureyuboのブックマーク (2)

  • さぼてん: PHP+MySQL+UTF-8で文字化け対策

    Webサイト制作。PHPとかMySQLとかプログラム寄り。symfony、CakePHPPerlと和解交渉中。 自分は遭遇した事無いけど、今後の参考に。 PHPの内部処理の文字コードがEUCベースな為、UTF-8で作っていくとフォーム値が文字化けしてしまう事があるらしい。 結構多いトラブルの模様。 解決策としては、内部処理の文字コードをUTF-8に変更してから受け取る様にすると良い。 自分の経験で悩まされたのは、DBの文字化け。 DBを一から構築する場合は最初からUTF-8で作っていけば良いけど、サーバの移転だったり既存のデータを使ったプログラムを組みときは文字化けが大変。EUC-JPが多い。 その時は以下のコードで文字コードを指定したクエリを発行して乗り越えられた。 <? mb_language("uni"); mb_internal_encoding("utf-8"); /

    ureyubo
    ureyubo 2009/11/03
    さくらにdotProjectを入れるときにはまったので。
  • 付録D URLエンコーディング(URLエンコード または URLエスケープ)

    フォームから問い合わせ文字列を受け取ったり、 クッキーを発行するとき、 HTTPプロトコルとCGIが適正に処理できるデータ形式に変更する必要があります。 そこで、 付録Dでは、 HTTPクライアントとCGIプログラムで行われている、 URLエンコーディングについて解説します。 実はRFCで"%16進数表記"でエンコードしなくて良い文字が規定されてはいます。 しかし、 実際にエンコードされる文字はプログラムによってまちまちで、 統一されているわけではないのが2003年8月の現状です。 D.1 URLエンコーディングとデコーディング まずは手っ取り早くURLエンコーディングの方法とデコードする方法について挙げ、 後からじっくりとHTTPやCGIの仕様ではどうなっているか解説します。 D.1.1 エンコードする方法 URLエンコードは1文字(ただし1バイト = 1オクテット)毎に行います。 その

  • 1