タグ

PythonとRegularExpressionに関するsconvictのブックマーク (2)

  • 5. 文字列の変更

    ここまでは、静的な文字列に対して探索を行ってきました。 しかし、正規表現は、様々な方法で文字列を変更するのにも、よく使われます。 5.1. 文字列の分割 RegexObject の split() メソッドは、正規表現がマッチした全ての部分で文字列を分割し、各部分をリストで返します。 似たようなものとして string.split() があり、これは一般的な区切り記号で分割するのに使われます。 string.split() は空白文字か固定の文字列での分割のみをサポートしています。 ご想像のとおり、モジュールレベルの re.split() 関数もあります。 split(string [, maxsplit = 0] ) 正規表現にマッチした部分で、文字列を分割する。正規表現の中で、グループ取得に括弧が使われたら、グループの内容も戻り値リストに含めて返される。もし maxsplit が 0

  • Pythonで正規表現による文字列処理(検索・置換・分割)を行う - 試験運用中なLinux備忘録・旧記事

    正規表現操作を行う「re」モジュールを使用すると、文字列の高度な検索・置換・分割処理が行える。 文字列のパターンを独自のルールで記述して関数を呼ぶことで、対象文字列がこれに当てはまるかを確認することができるのだが、マッチした部分を取り出したり別の文字列に置き換えたりすることもできる。 また、パターンにマッチした部分を区切りにした分割も行える。 (2014/10/4)リンク先修正やサンプルコードの修正を行った。 簡単な検索・置換・分割では使用しない 関数を使用した例 パターンのコンパイルを使用する 簡単な検索・置換・分割では使用しない決まった文字列で検索・置換・分割を行う場合、高速な文字列メソッドを使用することを推奨。当に正規表現を使用する必要があるのかを判断しないと、無駄に処理が遅くなってしまうかもしれない。 関数を使用した例re.sub()で置換を行い、re.search()やre.m

    Pythonで正規表現による文字列処理(検索・置換・分割)を行う - 試験運用中なLinux備忘録・旧記事
  • 1