タグ

正規表現に関するfoussinのブックマーク (3)

  • Perl 5.20 以後 $& は遅くない - tokuhirom's blog

    Perl では長らく $& を一度でもプログラム中に記載しているとあらゆる正規表現マッチが遅くなるというイシューが知られていた。 しかし perldoc perlvar してみると、以下のように記載されている。 In Perl 5.20.0 a new copy-on-write system was enabled by default, which finally fixes all performance issues with these three variables, and makes them safe to use anywhere. Perl 5.20 以後では気にせずに $& を利用してもよいようだ。 という話が社内チャットで出た。

    foussin
    foussin 2015/06/20
    $& ...パターンマッチで一致した文字列がセットされる
  • 【第573回】UnicodeプロパティとPerl正規表現(その1:文字クラスとひらがなの範囲) : イジハピ!

    2014年04月09日15:48 【第573回】UnicodeプロパティとPerl正規表現(その1:文字クラスとひらがなの範囲) カテゴリすぐわかる気がするPerl文字コード【プチ】研究 query1000 Comment(0)Trackback(0) 今日はUnicode時代の(use utf8を使った)Perlの正規表現について考えてみたい。 あいかわらずヌルいことしか書かないからな。 詳説 正規表現 第3版posted with カエレバJeffrey E.F. Friedl オライリージャパン 2008-04-26 正規表現で、文字クラスというのがある。 [0-9]だと0,1,2,3,4,5,6,7,8,9というASCIIの数字のいずれか1文字にマッチする。 これは[0123456789]と等価である。 [a-zA-Z]だとASCII英数字1文字にマッチする。 これは[abcdef

    foussin
    foussin 2014/04/10
    文字コード「超」研究 の著者だけあって、かなり詳しい。書籍の初版本は誤植が多すぎて参ったけど(周りに校正できる編集者がいなかったんだろうな)…
  • 正規表現メモ

    \x{} \pは後続する名前が表すクラス(プロパティ、スクリプト、ブロック)に属する文字にマッチし、 \Pは後続する名前のクラスに属さない文字にマッチします。 クラスの名前が一文字のときはブレースを省略できます。 クラス名の前に^を置くことにより否定形の指定を行うことも可能です。 Perl 5.8 での変更点 Perl5.8以降(5.6でも使えたようですが)では \pや\Pで始まるプロパティ指定に標準Unicode属性を使うこともできます。 詳しくは perlunicode perlunicode - Perl における Unicode サポート を参照してください。 日語による説明が Unicodestandard にもあります。 Perl 5.8以降ではユーザーが任意のプロパティを作成することができます (IsまたはInを必ず前置)。 詳しくは perlunicode perluni

  • 1