タグ

ブックマーク / www.python.jp (2)

  • 7.2. re — 正規表現操作 — Python 2.6.2 documentation

    7.2. re — 正規表現操作¶ このモジュールでは、 Perl で見られるものと同様な正規表現マッチング操作を提供しています。パターンと検索対象文字列の両方について、 8 ビット文字列と Unicode 文字列を同じように扱えます。 正規表現では、特殊な形式を表したり、特殊文字の持つ特別な意味を呼び出さずにその特殊な文字を使えるようにするために、バックスラッシュ文字 ('\') を使います。こうしたバックスラッシュの使い方は、 Python の文字列リテラルにおける同じバックスラッシュ文字と衝突を起こします。例えば、バックスラッシュ自体にマッチさせるには、パターン文字列として '\\\\' と書かなければなりません、というのも、正規表現は \\ でなければならず、さらに正規な Python 文字列リテラルでは各々のバックスラッシュを \\ と表現せねばならないからです。 正規表現パター

  • 4.2.1 正規表現のシンタクス

    正規表現 (すなわち RE) は、表現にマッチ (match) する文字列の集合を表し ています。このモジュールの関数を使えば、ある文字列が指定の正規表現にマッ チするか (または指定の正規表現がある文字列にマッチするか、つまりは同じ ことですが) を検査できます。 正規表現を連結すると新しい正規表現を作れます。A と B が ともに正規表現であれば AB も正規表現です。一般的に、文字列 p が A とマッチし、別の文字列 q が B とマッチすれば、文 字列 pqは AB にマッチします。ただし、この状況が成り立つのは、 A と B との間に境界条件がある場合や、番号付けされたグルー プ参照のような、優先度の低い演算をA や B が含まない場合 だけです。 かくして、ここで述べるような、より簡単でプリミティブな正規表現から、 複雑な正規表現を容易に構築できます。正規表現に関する理論と実

  • 1