タグ

Perlとregexに関するdecoy2004のブックマーク (1)

  • 正規表現の略記法 \X

    あかね @akane_neko Unicodeのテキストをperlなどで正規表現で処理する場合任意の一文字は.でなく\Xを使うべきなんでしょか。つまりà(\x{0061}\x{0300})みたいな文字とかIVSとかを考慮。(これは多分ものかの先生に聞くべき@monokano ) ものかの @monokano @akane_neko ぉぉぉ「\X」知らなかった! 試してみると確かに結合文字も含んでちゃんとマッチしますね。 「Grapheme Cluster」のすべてにマッチするわけではなさそうですけど、ほとんど問題なさそう。これはイイ!

    正規表現の略記法 \X
  • 1