[B! regexp] syo-yuのブックマーク

syo-yu id:syo-yu

regexpに関するsyo-yuのブックマーク (12)

正規表現で任意文字列の否定 - mayokara memo
Perl正規表現雑技ある文字列とある文字列を含むものにマッチする正規表現 (?=.*foo)(?=.*bar) (?=.*foo)(?=.*bar)(?=.*hoge) ある文字列を含まないものにマッチする正規表現 (?:(?!foo).)* Proxomitronでいうところの(^abc)に相当するやつ。なるほど、否定先読みが使えるのね…… これは知ってると知らないとで差がつきそうだ。 ■ "abc"を含む行を抽出 $text =~ s/^((?!abc).)*?\n//gm; ■ "abc"で始まる行を抽出 $text =~ s/^(?!abc).*?\n//gm; ■ 素数判定後方参照のある正規表現の能力 - まめめも正確には、文字列の長さが素数かどうかを判定できます。2 文字以上のマッチが 2 回以上出現するかどうかを見ます。後方参照がポイント。 p (2..30).sel
syo-yu 2009/11/18
regexp

tips
リンク
regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found
2009年03月09日00:30 カテゴリLightweight LanguagesTips regexp - ^$でなくて\A\zを使おうまずは回答から。正規表現で「制御文字以外」のチェック - ockeghem(徳丸浩)の日記文字エンコーディングの妥当姓制御文字(\x00〜\x1f, \x7f)のチェック文字列長のチェックこのうち後ろ二つを正規表現として書くにはどうすればいいかを考えていました。こういう時には、「全文字がOKならOK」と考えるのではなく、「一文字でもNGならNG」と考えると楽になります。それは「スペースと非制御文字以外」なのですから、/[^ \S]/が求めていた正規表現で、=~ではなく!~が使うべき演算子ということになります。全角スペースもOKにしたければ、/[^ \x{3000}\S]/。[追記参照] [Run via Codepad] #!perl -
$regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found$
syo-yu 2009/03/10
programming

tips

javascript

java

security

perl

regexp

regex

character
リンク
Google Code Archive - Long-term storage for Google Code Project Hosting.
Code Archive Skip to content Google About Google Privacy Terms
syo-yu 2008/06/11
regex

mac

osx

software

programming

tools

opensource

cocoa

regexp
リンク
正規表現はお好き? - steps to phantasien
積んであった Beautiful Code を読んでみる. 第一章はカーニハンによる正規表現の話. 数十行のコードで簡単な正規表現を実装してみせる. パターン文字列を内部表現に変換せずマッチに使うぜ, コードも短い, ビューティホー! ...という主張なのだが, それはほんとにビューティホーなのか. UNIX 人の感覚にはついていけない. それにしても彼らは正規表現が好きだ. いつものその話ばかりしている. artu はいうまでもなくプログラミング作法にも正規表現が出てきた. まったくこのマンネリめ. そう斜に構えつつ読み直してみると, 案外ラディカルな話も載っているのに気付く. 9.7 "オンザフライコンパイル" より: Ken Thompson はまさにこの方法によって 1967 年に IBM7094 上に正規表現を実装した. 彼のバージョンは, 正規表現に含まれる様々な処理を小さ
syo-yu 2007/12/21
programming

regexp

llvm

unix
リンク
JavaScript で構文解析: Days on the Moon
C++ の特徴のひとつである演算子オーバーロード、その粋を極めたのが Boost Lambda (無名関数) と Boost Spirit (構文解析) ではないかと思っています。JavaScript では無名関数が使えるので Lambda に関しては間に合っているとも言えますが、Spirit はそうも行きません。JavaScript 2 で演算子オーバーロードがサポートされるのならチャレンジしてみようかななどと思ってそれきりになっていました。しかし、一部でパーサブームが起こっているというのを受け、Perl 6 Rules をつらつらと眺めているうち、正規表現のメタ文字を使えば文法定義をきれいに書けるのではと思い至りました。そこで実際に JavaScript でパーサジェネレータを作り、Spirit にあやかって Gin (ジン) と名づけてみました。文法定義正規表現リテラルを使うこ
syo-yu 2007/09/13
javascript

parser

library

XPath

tips

tutorial

Programming

regexp
リンク
Regexp-Assemble-0.38 - Assemble multiple Regular Expressions into a single RE - metacpan.org
Fix test prereqs; pod tests moved to xt (RT#122136, RT#122137) Many thanx to Karen Etheridge for these patches. Note: I (Ron) have no idea where the version 2.07 originally comes from, although I have seen it before. It was not in the very first distro I got my hands on. Anyway, I've reverted Karen's patch to 0.38 to match the current sequence of version #s. Apart from that, all these fine improve
syo-yu 2007/06/16
grep

module

perl

programming

regex

regexp

tool

cpan
リンク
PHPでメールアドレスを確認する「正しい方法」(Linux Journal誌の記事より) - J0hn D0e の日誌
本屋で立ち読みしてたら、Linux Journalって雑誌に "Validate an E-Mail Address with PHP, the Right Way" って記事が載っているのを発見したので、簡単に要約を。まず、以下のメールアドレスは「正しい」アドレスである、と紹介。 Abc\@def@example.com customer/department=shipping@example.com !def!xyz%abc@example.com これは、RFC3696からの引用。 RFC3696は、Application Techniques for Checking and Transf ormation of Names (名前の検査と変換のアプリケーション技法) ってやつで、そのなかに、 "Restrictions on em ail addresses" って章があるみたい。
syo-yu 2007/06/14
email

php

reference

tips

regexp
リンク
新Emacsの強力な置換機能を使いこなす - ZDNet Japan
印刷するメールで送るテキスト HTML 電子書籍 PDF ダウンロードテキスト電子書籍 PDF クリップした記事をMyページから読むことができます 6年ぶりの大きなアップデートとなったEmacs 22.1、CVS先端の開発バージョンを使っているユーザは、なんとなく見過ごしてしまっているかもしれないが、新しい機能には便利なものが多い。ここでは、特に強化された置換機能について取り上げる。使いこなせば強力なので、是非使ってみて欲しい。 replace-regexpがプログラマブル置換へとパワーアップ Emacsではreplace-regexpで正規表現置換ができる。現在主流となっている正規表現のスタイルはPerlに源流をおいたものが多いが、Emacsの正規表現はそれとは異なる。特にの表記などが独特だ。とはいえ、Emacsを愛しているならば、馴れるしかないだろう。書き方が違うだけ
syo-yu 2007/06/14
emacs

programming

regexp

tips
リンク
Perl正規表現雑技
このページは Perl5.6 を対象としています． perl スクリプトは EUC-JP で書かれることを想定しています．このページは正規表現メーリングリストを参考に，私が独自にメモとしてまとめたものです．このページの正規表現やスクリプトについての詳しい説明，わかりやすい説明はおそらくできません．このページに書かれているスクリプトは，個人の責任において実行してください．このページに書かれているスクリプトの利用・改造は自由です．その際はどこかにこのページの URI( http://www.din.or.jp/~ohzaki/regex.htm )を参考として記述していただければ幸いです(任意)．ご意見・ご感想・ご要望などはにお願いします．こう書いた方がいい，動かん，わからん，バグってる，これ書け，などなどお待ちしています．このページへのリンクは自由に張ってく
syo-yu 2007/06/05
development

encoding

japanese

perl

programming

reference

regex

regexp

正規表現

tips
リンク
正規表現からその正規表現にマッチするような例を生成する - soutaroブログ
本当にやりたいことは、型から、その型を持つようなRubyプログラムを生成するなんだけど(というかこれはHaskell界隈の人が喜んでやってるやつだよな、つまんね)、とりあえず正規表現で考えてみてた。正規表現は有限状態オートマトンになるわけで、ループがあるとやだなぁ、とか考えてたんだけど、研究室の後輩(オートマトン屋さん)に相談してみたら、少なくとも正規表現に限定してしまえば簡単になると言われた。確かに、よく考えてみれば、ループがある場合は*とかで明示されてる。そういうわけで30分くらいで作ったプログラム。実行例： $ ruby regen.rb /red|blue|green|(#[01234567890ABCDEF][01234567890ABCDEF][01234567890ABCDEF][01234567890ABCDEF][01234567890ABCDEF][0123456
syo-yu 2007/06/05
generator

programming

regex

regexp

ruby

research
リンク
reAnimator: Regular Expression FSA Visualizer
This application requires the Flash plugin. If the plugin is already installed, click here. Warning: include(../../includes/footer.php) [function.include]: failed to open stream: No such file or directory in /home/.sidestep/osteele/osteele.com/tools/reanimator/index.php on line 32 Warning: include() [function.include]: Failed opening '../../includes/footer.php' for inclusion (include_path='.:/usr
syo-yu 2006/03/26
regexp

visualize
リンク
すべての漢字を取り出す正規表現 - totonのブログ
http://www.unixuser.org/~euske/doc/python/sample.py.html # 日本語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html ［亜-煕］はJIS漢字を検出するときに使う正規表現になります。本文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので，すべての漢字を検出するには，[一-龠]を使用してください（龠は音読みで「ヤク」，訓読みで「ふえ」，Unicodeでは「9FA0」にあたります）。追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。
syo-yu 2005/11/05
programming

regexp
リンク
1