[B! 正規表現][tips] jjzakのブックマーク

jjzak id:jjzak

正規表現とtipsに関するjjzakのブックマーク (12)

正規表現をいまのうちに覚えておきたい人のためのリソース集
HTML5で正規表現がサポートされる、といったことをきっかけに、正規表現はプログラマだけでなくWebクリエイター全体のスキルとして求められていくものになっていくのではないでしょうか（参考：あまり知られていないけれど、HTML5では正規表現が使えるようになる）。ここではそうした正規表現の初学者や、一度挫折したけど再入門したい人、そしてより高度な内容をマスターしたいすべての人のためのリソース集を作りました。初学者向けには「はじめての正規表現」「はじめての正規表現」は、文字通り正規表現という言葉は知っていても中味はよく分からない、という初学者の方にぴったりのコンテンツ。紙芝居形式のプレゼンテーションで楽しく正規表現について把握できます。はじめての正規表現初学者の方には、次の2つの記事も手っ取り早く読めて概要を把握できますので紹介しておきます。使うほどに良さが分かる正規表現（1/2）
jjzak 2009/10/12
programming

tutorial

reference

regexp

正規表現

tips
リンク
TEXTdrop｜翻訳・オンラインカジノ日本円のプログラミング
Text Drop 翻訳、プログラミング、写真、カメラなどについて書いてます。スタイルガイド/コーディング規約やチートシートなど、ちょっと便利なものを翻訳しています。 TEXTdropでは、C++のプログラマーも利用できるパワフルな機能を搭載。C++のコードを書く際に行う手順や避けておきたい工程などを詳しく説明しています。コードスタイルラインの日本語版では、日本語訳やJ P Yへの換金もサポート。話題性があるオンラインカジノ日本円変換や入金の際のバグにも対応しています。統一性のあるコードを書くためのポイントや規約の種類を参考にする事ができます。
jjzak 2009/10/12
tips

cheatsheet

正規表現

regexp
リンク
SED 教室
SED 教室 SEDLEC Release 1.11 Copyright(c)1992-95 by Hiroaki Sengoku sengoku@gcd.org SED は、UNIX, MS-DOS など多くの OS 上で利用可能な非会話型ストリームエディタです。高機能である反面、スクリプトが慣れるまでは難しいので、あまり使われていませんでした。そこで少しでも多くの方に SED のすばらしさを知っていただきたいと思い、SED 教室を Nifty Serve FMCN フォーラム 17 番会議室で開講しました。その第一回目から第十三回目までの内容に加筆訂正を行ったものがこのパッケージです。 Release 1.00 (平成四年夏) SED 教室第一回〜第十一回 Release 1.11 (平成七年秋) SED 教室第一回〜第十三回 SED 教室パッケージは以下のファイ
jjzak 2009/09/19
正規表現

sed

tips

tutorial
リンク
回文や XML にマッチする鬼車の正規表現 - まめめも
ref: 鬼車正規表現 Version 5.9.1 ref: Ruby Freaks Lounge: 第6回 Ruby M17N 事始め:正規表現編 \g と \k について今までちゃんとわかってなかったけれど、少しわかったような気になったのでメモ。Ruby というより鬼車の話なので、PHP でも使えるかもしれない。試してないけど。田中哲スペシャル \g の基本 \g で参照される括弧の中身がそこにそのまま書かれたと思えばいい。 re = /\A(?<foo>abc...def)\g<foo>\z/ # \g<foo> を展開して考える # /\A(?<foo>abc...def)abc...def\z/ と同じ意味 p "abc123defabc123def".match(re) # マッチ p "abc123defabc456def".match(re) # マッチ p "abc1
jjzak 2009/04/14
ruby

regexp

tips

memo

正規表現

programming
リンク
サルにもわかる正規表現入門
１．正規表現とはなにか？端的に言えば、「いくつかの文字列を一つの形式で表現するための表現方法」です。では、なぜこの表現方法が有名なのかといえば、この表現方法を利用すれば、たくさんの文章の中から容易に見つけたい文字列を検索することができるためです。この形式を使えば、以下のようなコギャルの会話にもついていけます(^_^) 「Windows ってあって…WINDOWSかもしんないしぃ、次にスペースが入ってるかもしんないしぃ、入ってないかもしんないし、後にやっぱ９８が付くってゆーかー、もしかすると９５が付いてもいいかなぁって感じでぇ…」これ以上続けるとこちらがキレてしまいそうなのでこのあたりにしておきますが…これは、正規表現で書くと… W(indows|INDOWS) ?９[８５] って感じで一行で書けちゃうっていうかぁ…あ、つい、口調が移ってしまった(^_^;)…書けるのでありま
jjzak 2009/04/14
正規表現

programming

tips

tutorial

reference

editor

development

software

regexp
リンク
正規表現で「制御文字以外」のチェック - ockeghem's blog
一般に、セキュアコーディングの基本として入力値の検証（Validation）をせよということになっていますが、これが変な方向に行くといわゆる「サニタイズ」のような手法になってしまいます。以前も指摘したように、アプリケーションとしてのValidationは仕様に従って行うべきものです。ですが、概ねどの場合でも行うべき検証として以下があると思います。文字エンコーディングの妥当姓制御文字(\x00〜\x1f, \x7f)のチェック文字列長のチェックこのうち後ろ二つを正規表現として書くにはどうすればいいかを考えていました。つまり、「制御文字以外の文字でm文字以上n文字以下」というようなチェックです。m文字以上、n文字以下は、{m,n}で書けるので、問題は「制御文字以外の文字」です。これはtextタイプのinput要素で、かつアプリケーション仕様としては文字種の制限をしない場合を想定してい
jjzak 2009/03/22
regexp

tips

正規表現
リンク
テスト駆動で 0 から 255 の数字にマッチする正規表現へ変形してみる - Tociyuki::Diary
ぶくま経由で、RFC 3986 URI の日本語訳にたどり着き、読んでいました。スムーズな日本語ですんなりと読めて、良い訳だと思いました。私は誤訳を見つけられませんでした。それはともかく、読んでいる最中に、RFC3986 だけではないのですが、IPv4 アドレスの数字にマッチする構文が、正規表現向けでないのに改めて気になりました。RFC の記述をそのまま正規表現にすると、バックトラックをおこす書き方になっています。バックトラックがおきないようにするには、先頭から1文字ずつ見ていくだけで残りの選択肢のどれに進めばいいか決定できるようにすればよろしい。ということで、これをテスト駆動で正規表現に向いた記述に変更してみました。 ⇒ http://www.studyinghttp.net/cgi-bin/rfc.cgi?3986#Sec3.2.2 IPv4address = dec-octet
jjzak 2007/03/02
development

perl

regexp

tips

正規表現

programming
リンク
【インフォシーク】Infoseek ：楽天が運営するポータルサイト
日頃より楽天のサービスをご利用いただきましてありがとうございます。サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。メンテナンスが終了次第、サービスを復旧いたしますので、今しばらくお待ちいただけますよう、お願い申し上げます。
jjzak 2007/01/30
development

document

programming

reference

regexp

tips

正規表現
リンク
正規表現メモ
\x{} \pは後続する名前が表すクラス(プロパティ、スクリプト、ブロック)に属する文字にマッチし、 \Pは後続する名前のクラスに属さない文字にマッチします。クラスの名前が一文字のときはブレースを省略できます。クラス名の前に^を置くことにより否定形の指定を行うことも可能です。 Perl 5.8 での変更点 Perl5.8以降(5.6でも使えたようですが)では \pや\Pで始まるプロパティ指定に標準Unicode属性を使うこともできます。詳しくは perlunicode perlunicode - Perl における Unicode サポートを参照してください。日本語による説明が Unicodestandard にもあります。 Perl 5.8以降ではユーザーが任意のプロパティを作成することができます (IsまたはInを必ず前置)。詳しくは perlunicode perluni
jjzak 2006/11/06
正規表現

tips
リンク
すべての漢字を取り出す正規表現 - totonのブログ
http://www.unixuser.org/~euske/doc/python/sample.py.html # 日本語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html ［亜-煕］はJIS漢字を検出するときに使う正規表現になります。本文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので，すべての漢字を検出するには，[一-龠]を使用してください（龠は音読みで「ヤク」，訓読みで「ふえ」，Unicodeでは「9FA0」にあたります）。追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。
jjzak 2006/11/06
development

正規表現

javascript

programming

tips

regexp
リンク
第7章正規表現
正規表現とは、ある特定の文字列ではなく、文字列の一部をパターン化して表現する手法をいいます。複数行ある文章の中から文字列を検索する時に、検索したい文字列すべてを指定するのではなく、文字列の任意の一部を置き換え可能な状態にして検索をする場合に正規表現を用います。たとえば、UNIXやWindowsでは、文字列を検索するときに使用される正規表現として、「*」を任意の文字列（空き文字も含む）に、「?」を任意の1文字として使用することができます。パターンを、app* と表現すると、 apple application appeal などの文字列がマッチすることになります。この正規表現の方法は、当然ながらプログラム言語ごとに異なりますが、Perlの場合は他の言語に比べて非常に強力な正規表現によるパターンマッチ機能を備えており、より詳細にかつ容易にパターンマッチを行うことができるとされています。
jjzak 2006/11/06
教材資料

正規表現

tutorial

tips
リンク
正規表現の例
ドライブのルートではなく、テキストが文字、数字、およびアンダースコアだけで構成された、大文字の DOS/Windows パス
jjzak 2006/11/06
教材資料

正規表現

tips
リンク
1