タグ

正規表現に関するir9のブックマーク (8)

  • パフォーマンスを意識して正規表現を書く - Shin x Blog

    正規表現を書く際、どのようなパターンにマッチさせるか、どこをキャプチャするかという視点で記述することはあっても、パフォーマンスを考えて記述するというのはある程度知っている人でなければ忘れがちな視点です。 このエントリでは、バックトラックをメインに正規表現がパフォーマンスに及ぼす挙動について見ていきます。 対象の正規表現エンジン ここでは、従来型 NFA を対象としています。具体的には、PHP の preg_ 関数で利用している PCRE や mb_ereg 関数が利用している鬼車です。PerlRubyPythonJava、.NET でも従来型 NFA を採用しているので、似た挙動となるでしょう。 「従来型 NFA」や「バックトラック」などの用語については、「詳説 正規表現 第3版」のものを用いています。 バックトラックによるマッチ探査 正規表現エンジンでは、指定された文字列が、パ

    パフォーマンスを意識して正規表現を書く - Shin x Blog
  • なるべく短い正規表現で住所を「都道府県/市区町村/それ以降」に分けるエクストリームスポーツ - Qiita

    rex = /ごにょごにょ/ p "東京都文京区後楽1丁目3−61".match(rex).captures #=> ["東京都", "文京区", "後楽1丁目3−61"] みたいなやつ。なるべく短く。 実用性? そんなもの、うちにはないよ。 TL;DR 「読むのめんどくさい」という人用に最初に最終結果を置いておきます (...??[都道府県])((?:旭川|伊達|石狩|盛岡|奥州|田村|南相馬|那須塩原|東村山|武蔵村山|羽村|十日町|上越|富山|野々市|大町|蒲郡|四日市|姫路|大和郡山|廿日市|下松|岩国|田川|大村)市|.+?郡(?:玉村|大町|.+?)[町村]|.+?市.+?区|.+?[市区町村])(.+) あまり厳密ではないのでちゃんとしたとこでは使わないほうがいいです 住所データを用意する 郵便局からデータをダウンロードしておく。一ヶ月毎に更新されている。 → 郵便番号データ

    なるべく短い正規表現で住所を「都道府県/市区町村/それ以降」に分けるエクストリームスポーツ - Qiita
  • Python 3の正規表現で \d を使うな! - Qiita

    案外知られていないようなのですが、Python 3 標準の reモジュールの正規表現では\dがいわゆる全角数字にもマッチします。 実際に試してみます。 >>> import re >>> re.findall(r"\d", "012012") ['0', '1', '2', '0', '1', '2'] >>> \dが'0'、'1'、'2'にもマッチしていますね。 この挙動があまり知られていない原因としては、 Python 3の公式ドキュメントの「正規表現 HOWTO」の説明が、かなり誤解を招きやすい書き方になっている。 \dがいわゆる全角数字にマッチするかどうかをわざわざテストする人は少ない 敬虔なPythonistaは正規表現を使わないやり方を好む傾向がある 等の理由が考えられますが、他の原因もあるかもしれません。 \dを[0-9]にだけマッチさせるには、\dの代わりに[0-9]を使う

    Python 3の正規表現で \d を使うな! - Qiita
  • gkbr.me

    このドメインを購入する。 gkbr.me 2018 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

  • spg credit cards hotel reservation at pj-blog.net

    SPGCredit CardsHotel ReservationBirthday CardsInsuranceWomen FashionOnline ClassPrintable Greeting CardsIndian SinglesBloggersホームページ 制作 It 求人ノート Pcウェブ デザインパソコン 販売ノート パソコンパソコン

  • BREGEXP DLL

    BREGEXP DLLは、正規表現(Regular Expression)APIを提供します。 あなたのアプリケーションにPerl5の正規表現パワーが欲しい方是非どうぞ。 BASP21 DLLの正規表現メソッドは、このAPIを使っています。 テキスト文字だけでなくヌル文字をサポートしますのでバイナリもOK。 Visual Basicからも使えます。 2000/04/29 Update Down Load! Linux版ライブラリbregexpは こちら ダウンロードファイル一覧 bregexp.dll  体 bregexp.h   ヘッダファイル bregexp.lib  Visual C++ 6.0 用LIBファイル breg50.lib   Visual C++ 5.0 用LIBファイル 正規表現の説明を追加 BREGEXP構造体の説明とBregPoolクラスのサンプル追加 関数呼出

    ir9
    ir9 2007/06/03
    正規表現dll。別ページには linux 用も。
  • 正規表現プログラミングFAQ

    正規表現プログラミングFAQ どこかの掲示板のどこかのスレの解説サイトらしきも の 基的に議論の中で省略された部分の解説でコピペは無しの方向で 参考:正規表現エンジンを設計する その2:遅延評価DFAエンジン設計 著作権に関して もくじ 正規表現に関して詳しい解説書 正規表現では扱い難い処理(HTMLの要素の抽出、Cのコメントの削除など) 06/07/19修正 正規表現と漢字 正規表現とUNIX regexのPerl拡張の特別な挙動(1.8までのRubyの特別な挙動) 処理速度が極端に遅い、フリーズする、異常終了する(アプリケーションが固まったと思ったら) Perlの流儀とPOSIX(動作の違い、注意点) 正規表現は文脈自由法か boostのバグ?new ブーリアン閉包の実装 new 状態遷移図の作成方法(図面を書くツールgraphviz) C/C++で使用可能なライブラリ(boost,

  • 【インフォシーク】Infoseek : 楽天が運営するポータルサイト

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • 1