[B! 文字コード] shiiiiirのブックマーク

shiiiiir id:shiiiiir

文字コードに関するshiiiiirのブックマーク (9)

スレッド公開討議:絵文字を含む場合のコード判定 - nkf Network Kanji Filter - OSDN
shiiiiir 2016/10/28
*あとで読む

文字コード
リンク
PHPでUnicodeアンエスケープしたJSONを出力する関数 - オープンソースこねこね
PHPの標準のjson関数だと日本語部分がunicodeエスケープされてしまい、「\u65e5\u672c\u8a9e」とか、ぱっと見よくわからん文字列になってしまうので、ちょっとデバッグがし難かったりします。JSONの仕様上では日本語そのままより、このようにエスケープされたほうが正しいようだけど。 PHPのマニュアルを読むとPHP5.4からはオプションにJSON_UNESCAPED_UNICODEを指定するとエスケープしないようなのですが、yumインストールに5.4が対応していなかったりで、ちょっと自分の環境では使えないのでUnicodeエスケープしないラッパー関数を書きました。参考にさせていただいた情報 http://d.hatena.ne.jp/iizukaw/20090422 コード /** * PHP5.4からでないと対応していないUnicodeアンエスケープをPHP5.3でも
shiiiiir 2016/10/03
エスケープ

JSON

encode

文字コード

*あとで読む

*開発
リンク
ASCIIコード表
ASCIIコード表 10進16進文字 0 0x00 NUL（null文字) 1 0x01 SOH（ヘッダ開始） 2 0x02 STX（テキスト開始） 3 0x03 ETX（テキスト終了） 4 0x04 EOT（転送終了） 5 0x05 ENQ（照会） 6 0x06 ACK（受信ＯＫ） 7 0x07 BEL（警告） 8 0x08 BS（後退） 9 0x09 HT（水平タブ） 10 0x0a LF（改行） 11 0x0b VT（垂直タブ） 12 0x0c FF（改頁） 13 0x0d CR（復帰） 14 0x0e SO（シフトアウト） 15 0x0f SI（シフトイン） 16 0x10 DLE（データリンクエスケープ） 17 0x11 DC1（装置制御１） 18 0x12 DC2（装置制御２） 19 0x13 DC3（装置制御３） 20 0x14 DC4（装置制御４） 21 0x15 NAK（
shiiiiir 2016/03/24
asciiコード表

文字コード

charset
リンク
[覚書]vimでsjisのファイルを開いたら文字化け。対処法は？
vi(ホントはvim)でうっかり（古き良き時代の）sjisファイルを開いて文字化けして困惑。程よく自分向けにチューニングを施されたLinux環境ならsjisファイルも素直に開けるが、インストールしたばかりの真新しいLinux環境に、まして日本人専用でもない代物に、かような緻密さを要求するというのは恥ずかしい。それに時代の潮流はasciiの亡霊^H^H^H^H^H ^H^H^Hutf-8だし。それに出先とか他人様の環境で~/.vimrcを弄くるなんてちょっと無能すぎるとか、いつも使うファイルはeucとutf-8でsjisやらは稀とか、文字コード認識がいつもうまく機能するとは限らないとか等など、一時的な文字コードの指定法を知っとくと役に立つ。なーんて下らない話は置いておいて、次の通り。 vi(vim)でファイルを開いて、文字化けしているところで次を打つ。exコマンドだわね :set fi
shiiiiir 2015/09/23
vim

vi

文字コード

*あとで読む
リンク
vimで文字コード指定してファイルを開く - Qiita
vim -c ":e ++enc=utf8" inedx.html vim -c ":e ++enc=euc-jp" inedx.html vim -c ":e ++enc=shift_jis" inedx.html
shiiiiir 2015/07/21
vim

*開発

文字コード
リンク
PHP の mbstring に関するメモ
このページについての説明・注意など PHP の mbstring 拡張モジュールについて調べてみました。mbstring 拡張モジュールは、PHP マニュアル : マルチバイト文字列関数 (mbstring) にも書かれていない機能や制約が多くあります。そのあたりをソースコードを確認しながらまとめてみました。更新内容については、更新履歴を参照してください。ソースコードの確認は主に PHP 5.2.5 〜 PHP 5.3.0 で行いました。PHP 4.x に対する記述もありますが、細かいバージョン等については十分に確認できていないものもあります。このページを読んで、間違い、誤字、脱字などがを見つけましたら、はてなの日記、または、メールなどで教えてください。 mbstring を使用する方法静的ライブラリとして組み込む方法共有ライブラリとして使用する方法 Windows 環境の場合 P
shiiiiir 2012/02/10
PHP

ライブラリ

mbstring

文字コード

charset

*あとで読む
リンク
マルチバイトの落とし穴 − ＠IT
ブラインドSQLインジェクションも不必要情報の脆弱性も覚えた星野君。だけど覚えないといけないことはまだまだありそうです。今日も赤坂さんといっしょにお勉強。「はい、これでクロスサイトスクリプティングやってみせて」赤坂さんがそういって見せてくれた勉強用のWebアプリケーション、あれ、見たところ完ぺきなんですが…… 高橋さん　「どうよ？」星野君　「え……。どうって何がですか？」高橋さんは唐突に会話を始めることが多い。大抵の場合、星野君には何の話か分からない。高橋さん　「こないだ赤坂さんとWebアプリの検査したでしょ。どうかなって」星野君　「どう……っていうか、なんか難しい感じでした。簡単なのはすぐに見つけられると思うんですけど……」高橋さん　「ふーん……」高橋さんはしばらく考え込んだ後、赤坂さんに声を掛けた。高橋さん　「ねぇ、赤坂さん。いまって暇？暇だよねー？」赤坂さん　「いや
shiiiiir 2012/01/18
文字コード

セキュリティ

PHP

プログラミング

*あとで読む
リンク
accept-charset属性 | ばけらの HTML リファレンス(未完成)
この属性を持つ要素 …… form accept-charsetの解説フォームに日本語の文字を入れて送信したりする場合、それは何らかの文字符号化方式でエンコードされて送信することになります。受け側のシステムは符号化方式を自動判別して良きに計らってくれることもありますが、特定の符号化方式でないとうまく処理できない場合もあります。特に最近の blog などには UTF-8 でないと処理できないシステムが多く、トラックバックが文字化けするなどという現象が良く発生します。 HTML4 では、受け側が処理できる文字符号化方式を form要素の accept-charset属性で指定することができます。たとえば、UTF-8 で送信したいような場合は、以下のようにします。
shiiiiir 2012/01/17
文字コード

HTML

*あとで読む
リンク
文字コード変換　(iconv) - ＡＩＸメモ
ファイル文字コードの変換方法 # iconv -f 変換前コード -t 変換後コード変換前ファイル > 変換後ファイル主なコードテーブル文字コード・・・コードテーブル Unicode・・・ UTF-8 SJIS・・・IBM-943 EUC・・・IBM-eucJP EBCDIC・・・IBM930 例：SJISをUTF-8（unicode）に変換する # iconv -f IBM-943 -t UTF-8 InputFileName > OutputFileName ※補足：AIX上のkshをLinux上で参照する場合は上記でOK 注：EBCDICからUnicodeへは直接変換できないので、一度SJISに変換後、Unicodeに変換する −−−−−−−−−−−−−−− サポートされている文字コードの表示 # iconv -l ASCII=GR CNS118643.1986-1 CNS11
shiiiiir 2012/01/12
Linux

コマンド

iconv

*あとで読む

文字コード
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx