タグ

regexに関するk1mのブックマーク (13)

  • プログラミング言語 Ruby リファレンスマニュアル

    注: Rubyは2.1.0からSemantic Versioningを採用しています。 Ruby 2.1.1, 2.1.2等はバグ修正やセキュリティfixのみを含むため、リファレンスとしては2.1に統一しています。

    k1m
    k1m 2007/03/08
    Ruby は鬼車にならないと後戻りマッチがない
  • {perl,ruby} -nle 'print if /start/../end/' : 404 Blog Not Found

    2006年12月22日19:00 カテゴリLightweight Languages {perl,ruby} -nle 'print if /start/../end/' アルファギークでも知らなかったというのは、不思議でもあり当然のようでもあり。 naoyaグループ - naoyaの日記 - if /regexp/../regexp/ Perl で正規表現を .. すると、その間に含まれる文字列という意味でマッチさせられる。 % w3m -dump_source http://www.yahoo.com/ | perl -nle 'print if /^<style/../<\/style>/' とするとこれ、実に由緒正しい使い方で、たしかまだperlがhashすらサポートしていない頃からあったと記憶しています。なにしろsed/awkが起源ですから。 NAME operator - se

    {perl,ruby} -nle 'print if /start/../end/' : 404 Blog Not Found
    k1m
    k1m 2006/12/22
    />\/style>/ じゃマッチしません
  • Sorekika 第352回 イレギュラー・エクスプレッション

    第352回 イレギュラー・エクスプレッション 変わっている人というのはどこにでもいるものだろうけれど、コンピュータ業界には特に多いように思われる。たとえば、新しい言葉を聞いて「頭の中に単語登録しておきます」と言ったり、頼んだ出前がなかなか来ないと「ルーティングおかしいんじゃないか」と呟いたり、捜し物が見つからず「404だ」と叫んだりと、日常会話にコンピュータ用語を持ち込む人は結構いる。まあしかし、この程度ならどのような業種でもあることかもしれない。 だが、正木氏はそんなもんではない。 正木氏は取引先のエンジニアで、はじめて会ったのはある打ちあわせの席である。かなり大人数での打ちあわせだったし、その時はほとんど喋らなかったので、私は彼の「変わっている具合」に全く気付かなかった。ちょっと変だなと思ったのは、仕事でメールをやりとりするようになってからである。 正木氏のメールにこのような部分があっ

    k1m
    k1m 2006/09/13
    パラメーハテナターハテナ
  • http://staff.aist.go.jp/tanaka-akira/textprocess/

    k1m
    k1m 2006/09/13
    akr さん
  • 2006/03/17 - memo - unknownplace.org

    川o・-・)<2nd life - JavaScriptCSS の query に自動で最終更新時間をつける Rails Plugin インスパイア。 package Catalyst::Plugin::URI::MtimeQuery; sub uri_for { my $c = shift; my $res = $c->NEXT::uri_for(@_); if ( $res =~ /\.(css|js|swf)$/ ) { my $base = $c->req->base; my ($path) = $res =~ m!^$base/(.*)!; my $file = $c->path_to( 'root', split '/', $path ); if ( $file->stat && -f _ && -r _ ) { $res .= '?' . $file->stat->mt

    k1m
    k1m 2006/09/13
    YAML.pm では regex: !perl/regexp:\n REGEXP: ... で正規表現をよみこむ
  • UTF-8 vs. ISO-10646 : 404 Blog Not Found

    2006年03月11日13:07 カテゴリLightweight Languages一日一行野郎 UTF-8 vs. ISO-10646 これだとLiberalなUTF-8ですね。 [を] UTF-8 の文字にマッチする正規表現 UTF-8の文字にマッチする正規表現の素直版。 新旧、というのか、LiberalなUTF-8とStrictなUTF-8の違いは、RFC2044とRFC2279を見ればはっきりします。要はU+11000より上を認めるかどうかということです。今のところUnicode.orgの定義では、U+0000 - U+10FFFF しか認めていないので、そちらの定義に従うと、むしろこの正規表現はさらに短く $RE_UTF8CHAR_STRICT = qr/(?:[\x00-\x7f]|[\xC0-\xDF][\x80-\xBF]|[\xE0-\xEF][\x80-\xBF]{2}

    UTF-8 vs. ISO-10646 : 404 Blog Not Found
    k1m
    k1m 2006/09/13
    LiberalなUTF-8とStrictなUTF-8の違い
  • reAnimator: Regular Expression FSA Visualizer

    This application requires the Flash plugin. If the plugin is already installed, click here. Warning: include(../../includes/footer.php) [function.include]: failed to open stream: No such file or directory in /home/.sidestep/osteele/osteele.com/tools/reanimator/index.php on line 32 Warning: include() [function.include]: Failed opening '../../includes/footer.php' for inclusion (include_path='.:/usr

    k1m
    k1m 2006/09/13
    正規表現のオートマトンを視覚化
  • Realtime validation using Ajax

    Posted by masuidrive Wed, 04 Jan 2006 21:45:00 GMT Ajaxなどを駆使して、入力値を動的にチェックするライブラリ、realtime validation を公開しました。 >> http://masuidrive.jp/validation 正規表現とメッセージを指定するだけで、入力した瞬間にユーザに対してガイドメッセージを表示させる事ができ、今までの様に画面遷移後にエラーが出て、ユーザがエラー位置を把握しづらいと言う事がありません。 これで、あなたのサイトも一気にWeb2.0! なのに使い方は超簡単。 prototype.js とvalidate.js を自分のHTMLに読み込んで、下記の様に正規表現で表示するメッセージを指定するだけ。 Validator.register({ "#mail" : { "/^([^@\\s]+)@((?:

  • use utf8なら\sは全角スペースもmatchする : blog.nomadscafe.jp

    use utf8なら\sは全角スペースもmatchする Femoで全角スペースでもTagのsplitができるように、と調べているのですが、 use utf8; をしている場合、\sは全角スペースにもmatchするようです。初めて気がついた。 #!/usr/bin/perl use strict; use warnings; use utf8; binmode STDOUT => ":utf8"; my $str ="全角 ス ペ ー ス が入った テキ\tス\nト"; print join ",",split /\s/,$str; の出力は 全角,ス,ペ,ー,ス,が入った,テキ,ス,ト となります。 perlretut - Perl の正規表現のチュートリアルによると、これも知らなかったのですが、 \sは空白キャラクタで [\ \t\r\n\f]を表します なのですね。 utf8の場合は、

    k1m
    k1m 2006/09/13
    ふむ
  • http://cvs.m17n.org/~akr/abnf/

    k1m
    k1m 2006/09/13
    RFC2234 の Augmented BNF を正規表現へ変換
  • UTF-8文字列をバイト数でカットした時の末尾の処理 - 徒書

    ……を先日考えていたところ、NiAOUさんよりサンプルスクリプトを提示して頂きましたが、面白そうなので自分でも他のやり方がないか考えてみました(Perlクイズばりに)。 # hint: uft-8 の一文字の正規表現 # [\x00-\x7F]| # [\xC0-\xDF][\x80-\xBF]| # [\xE0-\xEF][\x80-\xBF][\x80-\xBF]| # [\xF0-\xF7][\x80-\xBF][\x80-\xBF][\x80-\xBF]| # [\xF8-\xFB][\x80-\xBF][\x80-\xBF][\x80-\xBF][\x80-\xBF]| # [\xFC-\xFD][\x80-\xBF][\x80-\xBF][\x80-\xBF][\x80-\xBF][\x80-\xBF] 実のところ知りたかったのはこの部分で、最高何バイトまであり得るのかとか、各

  • Perl正規表現雑技

    このページは Perl5.6 を対象としています. perl スクリプトは EUC-JP で書かれることを想定しています. このページは 正規表現メーリングリスト を参考に,私が独自にメモとしてまとめたものです. このページの正規表現やスクリプトについての詳しい説明, わかりやすい説明はおそらくできません. このページに書かれているスクリプトは, 個人の責任において実行してください. このページに書かれているスクリプトの 利用・改造は自由 です. その際はどこかにこのページの URI( http://www.din.or.jp/~ohzaki/regex.htm )を参考として記述していただければ幸いです(任意). ご意見・ご感想・ご要望などは にお願いします.こう書いた方がいい, 動かん,わからん,バグってる,これ書け,などなどお待ちしています. このページへの リンクは自由 に張ってく

    k1m
    k1m 2006/09/13
  • ばけらのPerlメモ | 鳩丸よもやま話

    my と代入と式の評価my による宣言や代入が成功したか否かが評価されるのではなく、変数の値が評価されます。 my $temp = 1 or print "1: fail\n"; my $temp = 0 or print "0: fail\n"; my $temp or print "fail\n";

    k1m
    k1m 2006/09/13
  • 1