タグ

正規表現に関するgoto553のブックマーク (17)

  • LinkShare→PHGのURL置換を正規表現とプラグインで解決!URLパターンの検証もしてみた

    PHGの審査登録手順なんかは色々な方が書かれているのでこちらでは省きますね。 iTunesアフィリエイトの提携先がLinkShareからPHGへ変更 | room402 この記事は審査も承認下りて、いざアフィリンクの移行という方が対象です。 今回の対応にあたって上記の2記事を超参考にさせていただきました。 はじめはこれでサクッといけるんじゃね?なんて思ってましたが、これらの方法ではiPhoneアプリ紹介以外のMacアプリ、iTunesミュージックのリンクが漏れていた・・・。 これから書く手順も上の記事x2+αといった感じです。 SearchRegexプラグインを使用してDB内をPHGリンクに一括置換 今回はこの通り「データベースの中から、要は根底からキレイにPHGに移行しちゃいましょう!」という内容です。 さすが皆さん対応早いもので、すでにリンク変換するWordPressプラグインやJav

    LinkShare→PHGのURL置換を正規表現とプラグインで解決!URLパターンの検証もしてみた
  • HTML5Pattern

    You can directly edit the above text, by clicking on it. To add a new case, you have to press Alt+Enter. For removing a case just press Alt+Backspace or Alt+Delete. You can save or send the pattern by just copying the link. Have fun! Privacy policy / Datenschutzerklärung Allgemeiner Hinweis und Pflichtinformationen Benennung der verantwortlichen Stelle Die verantwortliche Stelle für die Datenverar

  • HTML5のバリデーションパターンが投稿&テストできる『HTML5 Pattern』 | 100SHIKI

    HTML5になってフォームのバリデーションが正規表現で出来るようになった。 そこで登場したのがHTML5 Patternだ。 このサイトを使えばドメイン、IPアドレス、ユーザー名などのバリデーションパターンをインタラクティブに試すことが出来る。 また自分で考えたパターンを投稿することも可能なようだ。 正規表現は厳密にやろうとすると大変なのだが、こうしたサイトでテストしながらうまく使いたいですな。

    HTML5のバリデーションパターンが投稿&テストできる『HTML5 Pattern』 | 100SHIKI
  • 正規表現愛

    弊社には、アンチ正規表現の人がいますが、私は熱烈な正規表現 Lover である。 大崎氏の「Perl 正規表現雑技」とかは、正規表現 Lover 垂涎のコンテンツとして、ブラウザのリンクバーに入れている程である (嘘)。 正規表現は覚えてモノにすれば、シアワセになれる素晴らしい仕組みなのです。 昨日、Shibuya.pm のテクニカルトークに行った際「はてなでは XML 系の CPAN モジュールはあまり使っておらず、XML の parse には殆んど正規表現を使用している」という話が出てきて、嬉しさのあまり身震いした。 parser を書くのが面倒臭くて「XML::Simple 最強」とかホザいた自分に対しての自戒と、弊社の Chief Regular Expressioner という肩書を持つ (自称) 立場の人間として、たまには、正規表現ゴリゴリなネタでも書いてみようかなと思いますた

    正規表現愛
  • perlのUnicode Block正規表現とEncode::CJKConstantsによる文字クラス判定 - end0tknr's kipple - web写経開発

    unicodeには、ひらがなやカタカナ等の文字グループがblockとして定義されており、perl ver.5.8以降では、このblock名称による正規表現が使用できるそうです。 http://blog.livedoor.jp/sasata299/archives/51194035.html http://module.jp/blog/regex_unicode_prop.html unicodeにおけるblock名称一覧 unicodeで定義されているblockは、次のurlに記載されています。 http://web.hc.keio.ac.jp/~fujimura/lang/unicode.html http://www.unicode.org/charts/ よく使うblockは数種類に限定できますが、半角カナや機種依存にはちょっと 日語を扱う上で使用するunicode blockは、

    perlのUnicode Block正規表現とEncode::CJKConstantsによる文字クラス判定 - end0tknr's kipple - web写経開発
  • Encode-InCharset-0.03 - defines \p{InCharset} - metacpan.org

  • Perl-正規表現 - Wikibooks

    Perlは強力な 正規表現 をサポートしています。正規表現とは、大まかにいうと、検索の機能を高度化しやすくしたものです。Perl以外のJavaJavaSciptやPHPなども正規表現をサポートしていますが、Perlは古くから正規表現を格的にサポートしています。 また、Perlの拡張正規表現は、Perl Compatible Regular Expressions( PCRE ) としてPerlの外でも使うことができるため、正規表現のディファクトスタンダードの1つとなっています。 パターンマッチング[編集] =~[編集] 二項演算子 =~ は、左辺のスカラー式を右辺のパターンマッチに拘束します。 正規表現に関する操作では、デフォルトで $_ という文字列を検索したり変更したりします。 この演算子は、そのような操作を他の文字列に対して行うようにします。 右辺は、検索パターン (//)、置換

  • Unicodeでの正規表現 - ぱせらんメモ

    http://kjirou.sakura.ne.jp/mt/2008/10/python_unicode.html例えば、ユニコード型文字列の内、漢字のみ("一"〜"龥")をマッチさせる場合 l = re.findall(u"[\u4e00-\u9fa5]+", "ひらがな漢字カタカナascii".decode("utf-8")) print l[0].encode("utf-8") # -> "漢字" 他の言語と違ってUnicode型というデータ型があるので明瞭極まりない! (from http://kjirou.sakura.ne.jp/mt/) PythonはわからないけどPerlに通じるものを感じたのでPerlでやってみた。 まずは上記のコードに似せたパターン。スクリプトファイルはUTF-8で作成。 use strict; use warnings; use Encode; my

    Unicodeでの正規表現 - ぱせらんメモ
  • MODULE.JP - 日本語に絡むUnicodeブロックとスクリプト(正規表現)

    といった感じ。ちなみにjava.util.regexとPerlのUnicodeブロックは接頭子Inを使うが、.NETの場合は接頭子Isを使う、という差異があります。 Unicodeスクリプトとブロックの違いがビミョーに見えるけど、ブロックがコードブロックをゴリッと指定したものに対して、スクリプトは特定言語に関係する文字の種類を直接指定するものなのでブロックよりも断定的、って感じで見れば良かなと。ちなみにUnicode関連のドキュメントによるとUnicodeプロパティとスクリプトで日語の文章を表そうとすると m/(?:(?:\p{Hiragana}|\p{Katakana}|\p{Han}|\p{Latin}|\p{Common}) (?:\p{Inherited}|\p{Me}|\p{Mn})?)+/x; こんな感じになるそうな。実際流通している文章はこれより多様なので現実とは微妙に乖離

  • すべての漢字を取り出す正規表現 - totonのブログ

    http://www.unixuser.org/~euske/doc/python/sample.py.html # 日語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html [亜-煕]はJIS漢字を検出するときに使う正規表現になります。 文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので,すべての漢字を検出するには,[一-龠]を使用してください(龠は音読みで「ヤク」,訓読みで「ふえ」,Unicodeでは「9FA0」にあたります)。 追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。

    すべての漢字を取り出す正規表現 - totonのブログ
  • その場で動作させて確認する正規表現入門ツール「HiFi RegExp Tool」:phpspot開発日誌

    HiFi RegExp Tool - Write and Test Regular Expressions in Real-Time その場で動作させて確認する正規表現入門ツール「HiFi RegExp Tool」 ボックスの中に、正規表現を入れるだけで、リアルタイムにページの内容が正規表現に沿ってマッチング&ハイライト表示され、どの正規表現がどういう意味を表すのかというのが一目で超クイックに分かってしまう便利ツールです。 ボックスに入れられた正規表現に沿って次のように、ハイライト表示されて、カラフルに色分けしてくれます。マッチしたテキストの一覧もページ下部に色付きで分かりやすく表示してくれます。 ページ内のテキストはクリックすることで自由に書き換えることも可能です。 サイドバーには正規表現のチートシートも掲載されています。 これはかなり便利。正規表現入門の高速道路ですね。

  • Perlの謎(その8):正規表現 - 小池啓仁 ヒロヒト応援ブログ By はてな

    今回の謎は、正規表現です。 はじめての人のために解説をしてみました。 他言語からの人は、正規表現を使う機会がなかったかもしれませんが・・・。 Perlでは、正規表現を使うための言語と言っても過言ではありません。 正規表現を使うことによりテキスト(文字列)編集処理が飛躍的に楽になるのです。 そもそも正規表現は、人体の神経回路網を数学的に説明するための方法として開発されました。その後、UNIXのケン・トンプソンによってコンピュータでの検索アルゴリズムに引き継がれました。ちなみに、正規表現を初めて使用したアプリケーションは、UNIX のエディタedやexの祖となったQEDというエディタのようです。QED、ed、grep等を経てPerlに引き継がれたようです。 (そもそもの正規表現は、参考リンクのリンク先を参照しました) では、まずはじめにテストデータ、family.txt を用意します。 このテ

    Perlの謎(その8):正規表現 - 小池啓仁 ヒロヒト応援ブログ By はてな
  • JavaScript正規表現メモ。 (JavaScriptでよく使う書き方。) - こせきの技術日記

    タイトル変えました。旧タイトル「JavaScriptでよく使う書き方」。よく使うけど毎回忘れる。 正規表現にマッチするかどうか。 RegExp#testを使う。 /abc/.test("abcdefg") // => true String#searchはマッチした位置を返す。マッチしない場合は-1。先頭にマッチすると0でfalseなので注意。真偽値が欲しい場合はString#searchを使わない。 "abcdefg".search(/xxx/) // => -1 "abcdefg".search(/def/) // => 3 "abcdefg".search(/abc/) == false // => true 正規表現の部分マッチを得る。 部分マッチを得るには、RegExp#execかString#matchを使う。execとmatchの速度は大して変わらない。 正規表現のベンチマー

    JavaScript正規表現メモ。 (JavaScriptでよく使う書き方。) - こせきの技術日記
  • へぼへぼCTO日記 - 主要CPANモジュールのメールアドレスの正規表現

    use strict; use Encode; use Email::Address; use Email::Valid; use Email::Valid::Loose; use Email::Find::addrspec; my $wsp = '[\x20\x09]'; my $vchar = '[\x21-\x7e]'; my $quoted_pair = "\\\\(?:$vchar|$wsp)"; my $qtext = '[\x21\x23-\x5b\x5d-\x7e]'; my $qcontent = "(?:$qtext|$quoted_pair)"; my $quoted_string = "\"$qcontent*\""; my $atext = '[a-zA-Z0-9!#$%&\'*+\-\/\=?^_`{|}~]'; my $dot_atom_text = "$at

  • tokuhirom blog

    Blog Search when-present<#else>when-missing. (These only cover the last step of the expression; to cover the whole expression, use parenthesis: (myOptionalVar.foo)!myDefault, (myOptionalVar.foo)?? ---- ---- FTL stack trace ("~" means nesting-related): - Failed at: ${entry.path} [in template "__entry.ftlh" at line 3, column 25] - Reached through: #include "__entry.ftlh" [in template "entry.ftlh" at

  • 「かなり使えるPHPの正規表現まとめ」にツッコんでみる。 - あそことは別のはらっぱ

    かなり使えるPHPの正規表現まとめに404 Blog Not Found:「PHP使いはもう正規表現をblogに書くな」と言わせないでくれがDisかまして、まあほどよく荒れているわけですが。 Idea*Ideaの中の人も既に突っ込まれているのに「個人的にまだ検証していないのであれですが」なんていいながら次のエントリを書いてますし、たぶん修正する気がないんだな、ということで、あの正規表現にツッコミをいれてみようと思います。 ちなみにはてなブックマークのほうでは、perlの正規表現とPHPの正規表現が違う(ゆえにperlでの例を見てもPHPの参考にならないのでは?)、と思っている人がいるみたいですが、今どきのPHPperlであれば、正規表現に差はほとんどないです。差があるとしても、間違ったマッチを書くよりは少ない差です。 あと、これはブクマコメントにも要旨として書いたのですが「正規表現がいく

    「かなり使えるPHPの正規表現まとめ」にツッコんでみる。 - あそことは別のはらっぱ
  • regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found

    2009年03月09日00:30 カテゴリLightweight LanguagesTips regexp - ^$でなくて\A\zを使おう まずは回答から。 正規表現で「制御文字以外」のチェック - ockeghem(徳丸浩)の日記 文字エンコーディングの妥当姓 制御文字(\x00〜\x1f, \x7f)のチェック 文字列長のチェック このうち後ろ二つを正規表現として書くにはどうすればいいかを考えていました。 こういう時には、「全文字がOKならOK」と考えるのではなく、「一文字でもNGならNG」と考えると楽になります。それは「スペースと非制御文字以外」なのですから、/[^ \S]/が求めていた正規表現で、=~ではなく!~が使うべき演算子ということになります。全角スペースもOKにしたければ、/[^ \x{3000}\S]/。[追記参照] [Run via Codepad] #!perl -

    regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found
  • 1