タグ

Pythonと正規表現に関するdelegateのブックマーク (2)

  • Pythonでの正規表現の使い方 - Qiita

    正規表現の検索演算子やパターンや検索自体のルールはPerlPHPとほとんど変わりないみたいですが。 正規表現の関数の使い方などは全然違うので、自分の勉強&整理の為に書いておきます。 正規表現の検索演算子などには言及しません 初期設定 以下のライブラリーを読み込むことで、正規表現が使えるようになります。 正規表現を使うためには、2つ方法があります。 一つは、事前に検索するパターンをコンパイルしておく方法です。 この方法を使うと、同じパターンで何度も検索する場合に、毎回パターンを指定する必要なく、高速に検索することが出来るようになります。 http://docs.python.jp/3/howto/regex.html#compiling-regular-expressions それから、パターンの最初にrを付けることをを勧めします、付けなくても基的には大丈夫ですが、付けることによって文字

    Pythonでの正規表現の使い方 - Qiita
  • プログラミング工場 / Python 正規表現

    19 2010年01月19日 15:28 カテゴリPython 文字の種類で切り出す (Python) 漢字やヒラガナ,カタカナ,数字などの文字種類で切り出す. #!/usr/bin/env python # -*- coding: utf-8 -*- import re def parse(text): TOKENS = re.compile(u'[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[。.、,]|[a-zA-Z0-9]+') results = TOKENS.findall(text) return results text = u'平成22年1月19日,今日はとてもいい天気です.' for e in parse(text): print e ※全角英数,半角カタカナは未対応. 実行結果 平成 22 年 1 月 19 日 , 今日 はとてもいい 天気 です . 参考 すべての漢字を

  • 1