PHPの標準のjson関数だと日本語部分がunicodeエスケープされてしまい、「\u65e5\u672c\u8a9e」とか、ぱっと見よくわからん文字列になってしまうので、ちょっとデバッグがし難かったりします。JSONの仕様上では日本語そのままより、このようにエスケープされたほうが正しいようだけど。 PHPのマニュアルを読むとPHP5.4からはオプションにJSON_UNESCAPED_UNICODEを指定するとエスケープしないようなのですが、yumインストールに5.4が対応していなかったりで、ちょっと自分の環境では使えないのでUnicodeエスケープしないラッパー関数を書きました。 参考にさせていただいた情報 http://d.hatena.ne.jp/iizukaw/20090422 コード /** * PHP5.4からでないと対応していないUnicodeアンエスケープをPHP5.3でも
ASCIIコード表 10進16進文字 0 0x00 NUL(null文字) 1 0x01 SOH(ヘッダ開始) 2 0x02 STX(テキスト開始) 3 0x03 ETX(テキスト終了) 4 0x04 EOT(転送終了) 5 0x05 ENQ(照会) 6 0x06 ACK(受信OK) 7 0x07 BEL(警告) 8 0x08 BS(後退) 9 0x09 HT(水平タブ) 10 0x0a LF(改行) 11 0x0b VT(垂直タブ) 12 0x0c FF(改頁) 13 0x0d CR(復帰) 14 0x0e SO(シフトアウト) 15 0x0f SI(シフトイン) 16 0x10 DLE(データリンクエスケープ) 17 0x11 DC1(装置制御1) 18 0x12 DC2(装置制御2) 19 0x13 DC3(装置制御3) 20 0x14 DC4(装置制御4) 21 0x15 NAK(
vi(ホントはvim)でうっかり(古き良き時代の)sjisファイルを開いて文字化けして困惑。 程よく自分向けにチューニングを施されたLinux環境ならsjisファイルも素直に開けるが、インストールしたばかりの真新しいLinux環境に、まして日本人専用でもない代物に、かような緻密さを要求するというのは恥ずかしい。それに時代の潮流はasciiの亡霊^H^H^H^H^H ^H^H^Hutf-8だし。 それに出先とか他人様の環境で~/.vimrcを弄くるなんてちょっと無能すぎるとか、いつも使うファイルはeucとutf-8でsjisやらは稀とか、文字コード認識がいつもうまく機能するとは限らないとか等など、一時的な文字コードの指定法を知っとくと役に立つ。 なーんて下らない話は置いておいて、次の通り。 vi(vim)でファイルを開いて、文字化けしているところで次を打つ。exコマンドだわね :set fi
このページについての説明・注意など PHP の mbstring 拡張モジュールについて調べてみました。mbstring 拡張モジュールは、PHP マニュアル : マルチバイト文字列関数 (mbstring) にも書かれていない機能や制約が多くあります。そのあたりをソースコードを確認しながらまとめてみました。 更新内容については、更新履歴を参照してください。 ソースコードの確認は主に PHP 5.2.5 〜 PHP 5.3.0 で行いました。PHP 4.x に対する記述もありますが、細かいバージョン等については十分に確認できていないものもあります。このページを読んで、間違い、誤字、脱字などがを見つけましたら、はてなの日記、または、メールなどで教えてください。 mbstring を使用する方法 静的ライブラリとして組み込む方法 共有ライブラリとして使用する方法 Windows 環境の場合 P
ブラインドSQLインジェクションも不必要情報の脆弱性も覚えた星野君。だけど覚えないといけないことはまだまだありそうです。今日も赤坂さんといっしょにお勉強。 「はい、これでクロスサイトスクリプティングやってみせて」赤坂さんがそういって見せてくれた勉強用のWebアプリケーション、あれ、見たところ完ぺきなんですが…… 高橋さん 「どうよ?」 星野君 「え……。どうって何がですか?」 高橋さんは唐突に会話を始めることが多い。大抵の場合、星野君には何の話か分からない。 高橋さん 「こないだ赤坂さんとWebアプリの検査したでしょ。どうかなって」 星野君 「どう……っていうか、なんか難しい感じでした。簡単なのはすぐに見つけられると思うんですけど……」 高橋さん 「ふーん……」 高橋さんはしばらく考え込んだ後、赤坂さんに声を掛けた。 高橋さん 「ねぇ、赤坂さん。いまって暇?暇だよねー?」 赤坂さん 「いや
この属性を持つ要素 …… form accept-charsetの解説フォームに日本語の文字を入れて送信したりする場合、それは何らかの文字符号化方式でエンコードされて送信することになります。受け側のシステムは符号化方式を自動判別して良きに計らってくれることもありますが、特定の符号化方式でないとうまく処理できない場合もあります。特に最近の blog などには UTF-8 でないと処理できないシステムが多く、トラックバックが文字化けするなどという現象が良く発生します。 HTML4 では、受け側が処理できる文字符号化方式を form要素の accept-charset属性で指定することができます。たとえば、UTF-8 で送信したいような場合は、以下のようにします。
ファイル文字コードの変換方法 # iconv -f 変換前コード -t 変換後コード 変換前ファイル > 変換後ファイル 主なコードテーブル 文字コード・・・コードテーブル Unicode・・・ UTF-8 SJIS・・・IBM-943 EUC・・・IBM-eucJP EBCDIC・・・IBM930 例:SJISをUTF-8(unicode)に変換する # iconv -f IBM-943 -t UTF-8 InputFileName > OutputFileName ※補足:AIX上のkshをLinux上で参照する場合は上記でOK 注:EBCDICからUnicodeへは直接変換できないので、一度SJISに変換後、Unicodeに変換する −−−−−−−−−−−−−−− サポートされている文字コードの表示 # iconv -l ASCII=GR CNS118643.1986-1 CNS11
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く