タグ

正規表現に関するsatopianのブックマーク (5)

  • 正規表現:エスケープが必要な文字一覧 | WWWクリエイターズ

    2デリミタと同じ文字はエスケープが必要 正規表現パターン記述の中で、デリミタとの混同を避けるため、デリミタに利用した文字と同じ文字が出現するのであれば、それらはエスケープする必要があります。 Vimや、PHPPCRE正規表現)などの多くのプログラミング言語においては、正規表現パターンは、そのパターンの開始と終了を同一の任意の文字で囲むことになっています。これらの囲み文字を「デリミタ(delimiter)」と呼ばれます。 デリミタにはどんな文字を使っても構いませんが、一般的にスラッシュ「/」がよく用いられます。(Javascriptでは、リテラルによる宣言(例:var ptn = /pattern/)によるデリミタは「/」のみ認めらています。) //「/」がデリミタなので、パターン中ではエスケープする $ptn = '/https:\/\/www-creators.com\/archive

  • 正規表現:文字列を「含まない」否定の表現まとめ | WWWクリエイターズ

    「〜を含まない」といった、否定の意味を持つ正規表現を記述する場合、下記のように、大きく分けて2種類のケースがあります。 「特定の1文字を含まない」といった否定表現か、もしくは「正規表現パターンを含まない」といった表現かで、大きく解決の方針が異なる点に注意して下さい。 特定の1文字だけを否定したい場合は非常にシンプルです。この場合、「文字クラス」、もしくはエスケープシーケンスで表される文字型を利用する事で表現できます。 一方で、特定の正規表現パターンを否定したい場合、少し記述が複雑になります。今回は「否定先読み」を利用した表現を、この記事の後半にご紹介します。 基的な正規表現の記法はこの記事では触れませんので、不安な方はこちらの記事も合わせてご参照下さい: 正規表現とは?基構文とメタ文字一覧(サンプル付) それでは、順番に詳しく見ていきます。 任意の一文字を含まない文字列の正規表現 a「

  • \sが完全には空白文字を網羅できていなかった件 - Panda Noir

    「空白文字」が世の中に何種類あるかご存じですか?半角スペース、全角スペース、タブ、改行くらいは分かると思いますが、実は世の中にはもっと空白文字があります。なんと空白文字だけで30文字以上もあります。これだけある空白文字を、/\s/は果たして網羅できているのでしょうか?今回はこれについて調べてみました。 '\s'にマッチするスペース文字の一覧 仕様書を見てみる '\s'と等価な正規表現とは? 終わりに '\s'にマッチするスペース文字の一覧 2. スペースは" "だけじゃない的な話 ここのページに書いてあるスペース文字について、\sにマッチするか検証してみま した。 結論から書くと、\sは全てを網羅していませんでした。 青くなっている方が\sにマッチした文字、赤くなっている方がマッチしなかった文 字です。 名称文字 FILE SEPARATOR[�] GROUP SEPARATOR[�] R

    \sが完全には空白文字を網羅できていなかった件 - Panda Noir
  • PHP: 正規表現パターンに使用可能な修飾子 - Manual

    Regarding the validity of a UTF-8 string when using the /u pattern modifier, some things to be aware of; 1. If the pattern itself contains an invalid UTF-8 character, you get an error (as mentioned in the docs above - "UTF-8 validity of the pattern is checked since PHP 4.3.5" 2. When the subject string contains invalid UTF-8 sequences / codepoints, it basically result in a "quiet death" for the pr

    PHP: 正規表現パターンに使用可能な修飾子 - Manual
  • 欲張りなマッチと控え目なマッチ(最小量指定子)

    繰り返しを扱うメタ文字を使用するパターンの場合、対象の文字列のいくつかの個所のマッチすることがあります。その場合、デフォルトでは最大限にマッチする範囲が多くなる位置でマッチします。これを欲張りなマッチと呼びます。また最小量指定子を追加することで、一番少ない範囲とマッチするように変更することもできます。これを控えめなマッチといいます。ここでは Perl の正規表現で欲張りなマッチと控え目なマッチを行う方法について解説します。

    欲張りなマッチと控え目なマッチ(最小量指定子)
  • 1