他言語をメインでやっている方が、 PHPで正規表現を扱う際に気を付けたいことをまとめました。 1. preg系で日本語を扱うにはu修飾子 2. preg_match_all の戻り値 3. preg_match_all の検索結果 4. “/” で括る必要は無い 5. 後方参照は $1 で取る 1. preg系で日本語を扱うにはu修飾子 preg系は、そのままだと日本語を正確に扱えないので、u修飾子の指定が必要 # 非マッチ $result = preg_match('/は.ほ/', 'いろはにほへと'); var_dump($result); // -> 0 # マッチ # u修飾子が「文字列をUTF-8として扱う」フラグ $result = preg_match('/は.ほ/u', 'いろはにほへと'); var_dump($result); // -> 1 # これはマッ