via ときどきの雑記帖様。 ■[ぁ-ヶ]|[亜-黑] 日本語を検索する場合に使う正規表現。Shift_JISの範囲であればまずこれで足りる。 内部Unicode化されたものに関しては思い通りに行きません。 ... ちなみにこの辺の事情は、gawkやGNU sed、GNU grep、 Pythonなんかでも同じです。 404 Not Found 「日本語を検索」って結構やりたい事あると思うので。 utf-8としてPythonでもチェック。 うお。黑が文字参照としてうってもソースコード中にでないなぁ。 ?がそれです。 #!/usr/bin/env python # encoding: utf-8 import sys import os import re mpt = (re.compile(u'[亜-煕]'), re.compile(u'[亜-?]')) def main(): targe