タグ

正規表現に関するchorinskyのブックマーク (6)

  • Pythonで正規表現による文字列処理(検索・置換・分割)を行う - 試験運用中なLinux備忘録・旧記事

    正規表現操作を行う「re」モジュールを使用すると、文字列の高度な検索・置換・分割処理が行える。 文字列のパターンを独自のルールで記述して関数を呼ぶことで、対象文字列がこれに当てはまるかを確認することができるのだが、マッチした部分を取り出したり別の文字列に置き換えたりすることもできる。 また、パターンにマッチした部分を区切りにした分割も行える。 (2014/10/4)リンク先修正やサンプルコードの修正を行った。 簡単な検索・置換・分割では使用しない 関数を使用した例 パターンのコンパイルを使用する 簡単な検索・置換・分割では使用しない決まった文字列で検索・置換・分割を行う場合、高速な文字列メソッドを使用することを推奨。当に正規表現を使用する必要があるのかを判断しないと、無駄に処理が遅くなってしまうかもしれない。 関数を使用した例re.sub()で置換を行い、re.search()やre.m

    Pythonで正規表現による文字列処理(検索・置換・分割)を行う - 試験運用中なLinux備忘録・旧記事
  • Python備忘録 - 正規表現とか

    正規表現† コンパイルする方法 findall findallは見つかった文字列を全てリストにして返す。 import re p = re.compile("ab.", re.I) result = p.findall("AbdABCAAbb") print result finditer match matchは先頭の文字列がマッチしたらマッチオブジェクトを返す。何もマッチしない時はNone。 import re p = re.compile("ab.", re.I) result = p.match("Abd") print result.group() scanner search searchは文字列がマッチしたらマッチオブジェクトを返す。 import re p = re.compile("ab.", re.I) result = p.search("xxxAbd") print

  • 正規表現モジュールからはじめるスクレイピング - YAMAGUCHI::weblog

    はじめに こんにちは、Python界のつけ麺大王@麻布十番です。先日はpyqueryを使ってWebでスクレイピングをする方法をご紹介いたしましたが、そもそも昨今のプログラミング言語ではたいてい正規表現が使えるようになっていまして、単純なものならこれを使ってスクレイピングするのもいいですよねー、っつー話。ほんの10分やってみればわかると思います。 リンク 全部標準ドキュメントの正規表現操作のところに載ってます。日語ドキュメントはローカルに置いときましょう。 7.2. re — 正規表現操作 — Python 2.7ja1 documentation 確認したい点 パターンマッチさせようとしている文字列はstrかUnicodeか パターンもUnicodeにしなければいけなくなる re.UNICODEを付ける VERBOSEを使うのかどうか 長すぎるパターンでは積極的に使うべき エスケープすべ

    正規表現モジュールからはじめるスクレイピング - YAMAGUCHI::weblog
  • 転送中

    リダイレクトします 以前ここにあったブログは、現在 http://tech.tanb.me/2009/03/html.html にあります。 リダイレクトしますか。

    chorinsky
    chorinsky 2011/03/20
    リンク抽出~♪
  • 逆引きPython/正規表現 - 鯨飲馬食 @ wiki

    match()やsearch()、split()、sub()などは下のように正規表現オブジェクトをコンパイルする方法とそのまま用いる方法があります。 >>> import re >>> re.compile("a").match("abcdef") <_sre.SRE_Match object at 0xb7c05720> >>> re.match("a","abcdef") <_sre.SRE_Match object at 0xb7c05758>

    逆引きPython/正規表現 - 鯨飲馬食 @ wiki
  • 正規表現の基本: .NET Tips: C#, VB.NET

    正規表現の基ここでは.NET Frameworkの正規表現について基をごく簡単に(主に正規表現パターンについて)説明します。なお.NET Frameworkの正規表現はPerl5の正規表現に対応するようにデザインされているということなので、Perlの正規表現を理解していれば問題ありません。 なお、「正規表現テストツール」を使って正規表現のテストを行うことができますので、お役立てください。 正規表現で何ができるか正規表現は、文字列を検索するために使用します。正規表現を使うと、かなり複雑な検索が可能です。正規表現を利用する主なケースには以下のようなものが挙げられます。 文字列内に指定されたパターンと一致する部分があるか調べる。例えば、入力された文字列が電子メールアドレスとして適当か調べるなど。文字列から指定されたパターンと一致する部分を検索、抽出する。例えば、文字列内にあるURLの部分をす

    正規表現の基本: .NET Tips: C#, VB.NET
  • 1