タグ

regexpに関するotsuneのブックマーク (19)

  • 正規表現でアトミックグループが高速になる理由 - edry(えどりぃ)の粋狂

    2009年2月28日 22:41 理論的に高速になる表現だとしても、実際に高速になるかはベンチマークで確かめる必要があります。 404 Blog Not Found:regexp - possessive quantifier (独占的|絶対最大)量指定子とは何か? '<img alt="backtrack" src="bt.png">' =~ /"([^\"]+)"/; と '<img alt="backtrack" src="bt.png">' =~ /"([^\"]++)"/; は、どちらもbacktrackを見つけますが、後者の方が高速です。 うーん。この例だと両方ともマッチするするから、ステートを破棄することで高速になるというのが分かりにくいのかも。 そこで、Perl 5.8.8 でベンチマークの例を挙げながら、アトミックグループでステートを破棄した事により高速になる理由について

  • CodeRepos::Share – Trac

    otsune
    otsune 2008/11/12
    drry添削の正規表現化
  • 正規表現ベースの字句解析器を書くときは - 最速チュパカブラ研究会

    正規表現ベースの字句解析器を書くときは、narcissusというJSベースのJS処理系のコードを見るといいです http://mxr.mozilla.org/mozilla/source/js/narcissus/jsparse.js 面倒な正規表現の模範解答が載ってます。下手に自分で考えて誤爆するより、一流の人が書いたものを使いましょう 正規表現リテラル /^\/((?:\\.|[^\/])+)\/([gimy]*)/ 文字列(ダブルクォート、シングルクォート共)/^"(?:\\.|[^"])*"|^'(?:[^']|\\.)*'/ → 訂正 Cスタイルコメント(一行、ブロック共) /^\/(?:\*(?:.|\n)*?\*\/|\/.*)/ ↓narcissusについてはyukobaさんのプレゼンを(去年のShibuya.es) http://accelart.jp/shibuyajs

    otsune
    otsune 2008/04/30
    →正規表現ベースの字句解析器を書くときは、narcissusというJSベースのJS処理系のコードを見るといいです
  • sixnine.net

    sixnine.net 2024 著作権. 不許複製 プライバシーポリシー

  • Journal of miyagawa (1653)

    Lazyweb,Is there a module to debug your regular expression, to compare the target string and an input regular expression one byte by one? It'd be useful if you have an existent code to do a pattern match against a big chunk of string and don't know why it doesn't match. use Regexp::Debug; my $string = "abcdefg"; my $regexp = qr/abcefg/; # Notice 'd' is missing my $result = Regexp::Debug->compare

  • very magic - tino_9000の日記

    vimの正規表現は円記号が大量発生して使いにくいのだがvery magicというモードで軽減できる。 正規表現の前に\vを入れるだけ。 例えばTABの前後を入れ替える置換は以下の様になる。 :%s/^\([^\t]*\)\t\(.*\)/\2\t\1 :%s/\v^([^\t]*)\t(.*)/\2\t\1 OR検索とかわかりやすい /foo\(bar\|hoge\) /\vfoo(bar|hoge) 括弧とかORとか多用する場合には便利だと思う。

    very magic - tino_9000の日記
    otsune
    otsune 2007/10/12
    正規表現の前に\vを入れるだけ。
  • 正規表現の確認ができるエディタを作ってみた。 - 考え得る最高を常に行う

    正規表現の練習くらいにしか役に立たないですが作ってみました。 特徴 リアルタイムで確認ができる。 XHTMLJavascriptで作ったので保存すればローカルで使える。 JavaScriptで実装してるので一部使えない表現有り。 正規表現エディタ あとがき 最近ブログを更新してないので数ヶ月前に作ったやつを手直したものです。Firefox2(MAC)とIE7では動くの確認しました。あまり詳しくないんですが各ブラウザに多少、正規表現の実装が違う気がします。 patternを空にすると選択範囲がおかしくなるのを修正。

    正規表現の確認ができるエディタを作ってみた。 - 考え得る最高を常に行う
  • 正規表現の XPath 字句解析その2 - IT戦記

    またまた XPath ネタです。 先日、XPath の字句解析をワンライナーで作ってみた。 - IT戦記で書いた正規表現の XPath 字句解析ですが、よく考えるといろいろおかしかった(不正な文字が無視されたりする)& id:otsune さんからコメントやブクマの突っ込みもありまして、1から正規表現を勉強してから新しく書き直すことにしました。 正規表現の勉強方法 以下の二つの方法で勉強しました。 1.SpiderMonkey の正規表現デバッグオプションを使う SpiderMonkey をビルドするときに、以下のフラグを付けてビルドします。 $ make -f Makefile.ref "DEFINES=-DREGEXP_DEBUG -DDEBUG"こうすると正規表現がどういう風に実行されたかを調べることができます。 こんな感じ $ js js> 'foobar'.match(/o+/)

    正規表現の XPath 字句解析その2 - IT戦記
  • IT戦記 - XPath の字句解析をワンライナーで作ってみた。

    ソースコード var expression = '/html/body/div/[attribute::class="hoge fuga piyo"]'; var tokens = expression.match(/"[^"]*"|'[^']*'|\d+(?:\.\d*)?|\.\d+|\*|\/\/|\/|\||\+|!=|<=|>=|<|>|=|\(|\)|\[|\]|\.\.|\.|@|,|::|-|(?![0-9-:])[\w-]+:\*|\$(?:(?![0-9-:])[\w-]+:)?(?![0-9-:])[\w-]+|(?:(?![0-9-:])[\w-]+:)?(?![0-9-:])[\w-]+|\s+/g); // tokens is ["/", "html", "/", "body", "/", "div", "/", "[", "attribute", "::",

    IT戦記 - XPath の字句解析をワンライナーで作ってみた。
    otsune
    otsune 2007/08/29
    1文字の奴とか=で共通するのは文字クラスでよくね? バックトラックしないし
  • メルアドの正規表現に関して ■tokix.net

    Credit 累計: 今日: 昨日: リンクはご自由にどうぞ Since 2001/07/15 IE7, Fx2, Opera9 + CSS + Win IE5, Safari1 + CSS + Mac NN4, W3C Suxx Managed by. tokix (webmaster@tokix.net) Powered by. MovableType 正規表現、というモノに関して最低限以上の知識がある人向けの記事になってしまうが、「入力されたメールアドレスが正しいかどうか判定する正規表現」という話には、プラスアルファがある。ある程度以上正規表現を理解している人の中にも、この点を理解していない人が少なからず存在する、気がする、というか一流ウェブサービスにも不適切な(と僕が思う)正規表現を利用しているケースが少なからず存在する(宅ファイル便もそうだ)のでエントリーにしてみます。 正規表現

  • 正規表現:メールアドレスかどうか調べる - phpspot

    下記、正規表現は当に簡単なチェックで、厳密なチェックをしたい場合は別途検索エンジンなどで調べた方がいいでしょう。参考として、PHPでメールアドレスかどうか調べる方法や、こちらのページで紹介されているようなメールアドレスの正規表現が存在します。 あくまで簡易なので、厳密な正規表現を書きたい方は、小飼弾さんのブログを参照するのが良いかもしれません→メールアドレスの正しい正規表現 <?php $text = "mail@mail.com"; if (preg_match("/^([a-zA-Z0-9])+([a-zA-Z0-9\._-])*@([a-zA-Z0-9_-])+([a-zA-Z0-9\._-]+)+$/", $text)) { echo "正しいメールアドレスかもしれません"; } else { echo "正しくないメールアドレスではないかもしれません"; } ?> <?php

    otsune
    otsune 2007/05/30
    この正規表現は大雑把すぎて酷い。害を振りまいている
  • 【インフォシーク】Infoseek : 楽天が運営するポータルサイト

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • 正規表現の確認

    正規表現を入力すると即座に一致判定を行います。パターンや入力を変えながら あれこれ試行錯誤したい時などに使用してください。正規表現エンジンは JDK 1.6 (Sun Microsystems Inc. Java VM 10.0-b23) を使用しています。PerlJavaScript など他の言語の正規表現とは細かいクセが違う 可能性があるので注意して下さい。Java 正規表現の詳しい仕様は Pattern クラスの API リファレンスに記載されています。

  • 正規表現最新リンク集2005

    正規表現/文字コード最新リンク2005 [3000URL最新人気リンク発表][お報せ][開発管理運営者][サイトマップ] ★リンク追加希望はホムペ紹介掲示板へ | 文字主体の高速表示リンク集 | 紹介文付き ■:最近行ってない | ■:最近行った | ●リンク切れ最終チェック:2003/10/26 NEWSだ!(^o^)/ : 台風 - 地図検索 Start is Hello world : HSP - C - Borland - VB - DLL&OCX - Web開発 - DB - 正規表現 コミュニティ : 掲示板 - 市場 - 出会い  トレンド : 月別レシピ(その季節しか出ない) メモ帳(M)あります : 小説 - 料理 - 占い - ? - 辞書&文例 - HARD - SOFT - 政 - 名スレ ◆正規表現って何? ◆正

  • Regular Expression

    sixnine.net 2024 著作権. 不許複製 プライバシーポリシー

  • Regular Expressions Cheat Sheet (V2) - Cheat Sheets - Added Bytes

    Overview The Regular Expressions cheat sheet is a one-page reference sheet. It is a guide to patterns in regular expressions, and is not specific to any single language. This is the second version of the Regular Expressions cheat sheet. The previous version can be found at http://www.addedbytes.com/cheat-sheets/regular-expressions-cheat-sheet-version-1/. If you like the cheat sheets, and want t

  • HTML要素を抜き出す正規表現の自動生成プログラム - llameradaの日記

    HTML要素を抜き出す正規表現を自動生成するプログラム html2regexp を作ったので公開します。 札幌市で賢い借金返済方法を教えます! 使い方は簡単で、HTMLファイル中の抜き出したいHTML要素の先頭タグの末尾にh2rと書き加えるだけです。例えば次のように指定します。 <ul> <li><a href="hoge" class="h" h2r>hoge</a></li> <li><a href="huga" class="h" h2r>huga</a></li> </ul> <div> <a href="f">f</a> </div>すると、html2regexpは、2つのa要素を抜き出す次の正規表現を生成します。 (<(\w*?)\s*([^>]*?" class="h"[^>]*?)>(.*?)<\/\2>)HTMLを抜き出して利用したり、Webアプリケーションのテストなどの

    HTML要素を抜き出す正規表現の自動生成プログラム - llameradaの日記
  • html2regexp - html2regexpはHTML要素を抽出する正規表現を自動生成するツール

    借金をしたときには、必ず返済しなければなりません。 多くの人がそのまま頑張って返さなければと考えがちですが、賢い借金返済方法を取ることでより楽に返せるようになるのです。

  • 正規表現愛

    弊社には、アンチ正規表現の人がいますが、私は熱烈な正規表現 Lover である。 大崎氏の「Perl 正規表現雑技」とかは、正規表現 Lover 垂涎のコンテンツとして、ブラウザのリンクバーに入れている程である (嘘)。 正規表現は覚えてモノにすれば、シアワセになれる素晴らしい仕組みなのです。 昨日、Shibuya.pm のテクニカルトークに行った際「はてなでは XML 系の CPAN モジュールはあまり使っておらず、XML の parse には殆んど正規表現を使用している」という話が出てきて、嬉しさのあまり身震いした。 parser を書くのが面倒臭くて「XML::Simple 最強」とかホザいた自分に対しての自戒と、弊社の Chief Regular Expressioner という肩書を持つ (自称) 立場の人間として、たまには、正規表現ゴリゴリなネタでも書いてみようかなと思いますた

    正規表現愛
  • 1