電話番号、郵便番号にマッチする真の正規表現 - にぽたん研究所 これ、実用には全くならない(使ってはいけない)けど面白いなあ。 この手の正規表現をどうやって生成するのかということですが、(自称)正規表現専門家の私が推測してみます。(ただの推測なので、正解かどうかは保証しません。) 簡単かつ等価な正規表現 結局、狂ったような正規表現に見えますが、本当は、次のような正規表現でも全く等価なものを正しく受理するのです。 (1010001|1010002|...) ←正しい郵便番号の並びが10万以上続く これは、郵便番号データさえあれば、誰でも作れる正規表現です。しかし、これをブログやらスライドに載せても「はいはい。楽しいですか?」といわれるだけです。これを難しげな正規表現に変換しないとネタになりません。 正規表現をコンパイル(NFA生成) この正規表現をコンパイルします。つまり、中身を解釈してNF