タグ

2013年10月7日のブックマーク (1件)

  • PHP: UTF-8 のバイト列の妥当性をチェックする

    2012/11/15 追記:タイトルを変更しました。また、次の記事では似た処理を扱っています。 UTF-8 のバイト列の範囲表PHP: UTF-8 のバイト列の妥当性をチェックするPHP: 不正なバイトを U+FFFD に置き換えるPHP: 不正なバイト列を削除するPHP: 不正なバイト列を考慮して文字列を配列に変換するPHP: 不正なバイト列を考慮して1文字ごとにコールバックを適用するPHP: 不正なバイト列を考慮した文字列のイテレータPHP: 不正なバイト列を考慮して文字列を一文字ずつ展開するジェネレータを作成するPHP: 不正なバイト列を考慮して文字列の一部を取得する関数を定義するUTF-8 のバイト列の範囲表をもとに処理を書いた。 $str = [ // 1、2、3、4バイト文字 'abcdeαβγδεあいうえお𠀋𡈽𡌛𡑮𡢽', // 5バイト文字 "\xf8\xbf\xb

    PHP: UTF-8 のバイト列の妥当性をチェックする