totonの日記さんに詳しいようです。 すべての漢字を取り出す正規表現 - totonの日記 「すべての漢字を取り出す正規表現」の続き - totonの日記 とはいえぐぐっただけです。 既に2005年に通過されていた模様。 mpt = [re.compile(u'[一-龠]')] def main(): target = u'漢字正規表現亜腕一十百千万億兆京' for mp in mpt: print "pattern = %s, target = %s" % ( mp.pattern.encode('utf-8'), target.encode('utf-8')) ml = mp.findall(target) for m in ml: print '%s' % (m).encode('utf-8'), print pass pattern = [一-龠], target = 漢字正規表