タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

pythonとregexpに関するtaketsのブックマーク (5)

  • すべての漢字を取り出す正規表現 - totonのブログ

    http://www.unixuser.org/~euske/doc/python/sample.py.html # 日語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html [亜-煕]はJIS漢字を検出するときに使う正規表現になります。 文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので,すべての漢字を検出するには,[一-龠]を使用してください(龠は音読みで「ヤク」,訓読みで「ふえ」,Unicodeでは「9FA0」にあたります)。 追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。

    すべての漢字を取り出す正規表現 - totonのブログ
    takets
    takets 2008/02/05
    - 日本語は大変だー。
  • 正規表現 - みずぴー日記

    30分プログラム、その46。Pythonで正規表現を使ってみよう。 今回、作ったのは正規表現でパスのディレクトリ部分、ファイル名の部分、拡張子の部分を取り出すプログラム。 $ python regexp.py ~/foo.txt direname: /Users/mzp basename: foo.txt ext: txtimport sys import re def basename(path): regexp = re.compile(r'^.*/') return regexp.sub('',path) def dirname(path): regexp = re.compile(r'(.*)/.*?$') o=regexp.match(path) if o != None: return o.group(1) def ext(path): regexp = re.compile(

    正規表現 - みずぴー日記
    takets
    takets 2008/02/05
    - 正規表現サンプル
  • pythonグループ - 正規表現のグループに名前を附けて參照する

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    pythonグループ - 正規表現のグループに名前を附けて參照する
    takets
    takets 2008/02/05
    - グループ超便利。
  • 正規表現 HOWTO

    当サイトの文書・画像等のコンテンツの著作権は、各コンテンツの作成者、もしくは日Pythonユーザ会に帰属します。 また、日Pythonユーザ会はサイト内のコンテンツに他のプログラミング言語からの乗り換えを誘発する恐れのある表現が多々あることを認め、予めお詫び申し上げます。

  • Python備忘録 - 正規表現とか

    正規表現† コンパイルする方法 findall findallは見つかった文字列を全てリストにして返す。 import re p = re.compile("ab.", re.I) result = p.findall("AbdABCAAbb") print result finditer match matchは先頭の文字列がマッチしたらマッチオブジェクトを返す。何もマッチしない時はNone。 import re p = re.compile("ab.", re.I) result = p.match("Abd") print result.group() scanner search searchは文字列がマッチしたらマッチオブジェクトを返す。 import re p = re.compile("ab.", re.I) result = p.search("xxxAbd") print

  • 1