[B! 正規表現] goto553のブックマーク

goto553 id:goto553

正規表現に関するgoto553のブックマーク (17)

LinkShare→PHGのURL置換を正規表現とプラグインで解決！URLパターンの検証もしてみた
PHGの審査登録手順なんかは色々な方が書かれているのでこちらでは省きますね。 iTunesアフィリエイトの提携先がLinkShareからPHGへ変更 | room402 この記事は審査も承認下りて、いざアフィリンクの移行という方が対象です。今回の対応にあたって上記の2記事を超参考にさせていただきました。はじめはこれでサクッといけるんじゃね？なんて思ってましたが、これらの方法ではiPhoneアプリ紹介以外のMacアプリ、iTunesミュージックのリンクが漏れていた・・・。これから書く手順も上の記事x2+αといった感じです。 SearchRegexプラグインを使用してDB内をPHGリンクに一括置換今回はこの通り「データベースの中から、要は根底からキレイにPHGに移行しちゃいましょう！」という内容です。さすが皆さん対応早いもので、すでにリンク変換するWordPressプラグインやJav
goto553 2013/09/03
正規表現

アンコウテルオ

レスラー
リンク
HTML5Pattern
You can directly edit the above text, by clicking on it. To add a new case, you have to press Alt+Enter. For removing a case just press Alt+Backspace or Alt+Delete. You can save or send the pattern by just copying the link. Have fun! Privacy policy / Datenschutzerklärung Allgemeiner Hinweis und Pflichtinformationen Benennung der verantwortlichen Stelle Die verantwortliche Stelle für die Datenverar
goto553 2011/07/07
html5

正規表現

validation

form
リンク
HTML5のバリデーションパターンが投稿＆テストできる『HTML5 Pattern』 | 100SHIKI
HTML5になってフォームのバリデーションが正規表現で出来るようになった。そこで登場したのがHTML5 Patternだ。このサイトを使えばドメイン、IPアドレス、ユーザー名などのバリデーションパターンをインタラクティブに試すことが出来る。また自分で考えたパターンを投稿することも可能なようだ。正規表現は厳密にやろうとすると大変なのだが、こうしたサイトでテストしながらうまく使いたいですな。
goto553 2011/07/07
html5

正規表現

validation

form
リンク
正規表現愛
弊社には、アンチ正規表現の人がいますが、私は熱烈な正規表現 Lover である。大崎氏の「Perl 正規表現雑技」とかは、正規表現 Lover 垂涎のコンテンツとして、ブラウザのリンクバーに入れている程である (嘘)。正規表現は覚えてモノにすれば、シアワセになれる素晴らしい仕組みなのです。昨日、Shibuya.pm のテクニカルトークに行った際「はてなでは XML 系の CPAN モジュールはあまり使っておらず、XML の parse には殆んど正規表現を使用している」という話が出てきて、嬉しさのあまり身震いした。 parser を書くのが面倒臭くて「XML::Simple 最強」とかホザいた自分に対しての自戒と、弊社の Chief Regular Expressioner という肩書を持つ (自称) 立場の人間として、たまには、正規表現ゴリゴリなネタでも書いてみようかなと思いますた
goto553 2009/12/25
正規表現

perl

qr
リンク
perlのUnicode Block正規表現とEncode::CJKConstantsによる文字クラス判定 - end0tknr's kipple - web写経開発
unicodeには、ひらがなやカタカナ等の文字グループがblockとして定義されており、perl ver.5.8以降では、このblock名称による正規表現が使用できるそうです。 http://blog.livedoor.jp/sasata299/archives/51194035.html http://module.jp/blog/regex_unicode_prop.html unicodeにおけるblock名称一覧 unicodeで定義されているblockは、次のurlに記載されています。 http://web.hc.keio.ac.jp/~fujimura/lang/unicode.html http://www.unicode.org/charts/ よく使うblockは数種類に限定できますが、半角カナや機種依存にはちょっと日本語を扱う上で使用するunicode blockは、
goto553 2009/11/27
unicode

perl

cpan

文字コード

jis

0208

正規表現
リンク
Encode-InCharset-0.03 - defines \p{InCharset} - metacpan.org
goto553 2009/11/27
cpan

unicode

perl

文字コード

正規表現
リンク
Perl-正規表現 - Wikibooks
Perlは強力な正規表現をサポートしています。正規表現とは、大まかにいうと、検索の機能を高度化しやすくしたものです。Perl以外のJavaやJavaSciptやPHPなども正規表現をサポートしていますが、Perlは古くから正規表現を本格的にサポートしています。また、Perlの拡張正規表現は、Perl Compatible Regular Expressions( PCRE ) としてPerlの外でも使うことができるため、正規表現のディファクトスタンダードの１つとなっています。パターンマッチング[編集] =~[編集] 二項演算子 =~ は、左辺のスカラー式を右辺のパターンマッチに拘束します。正規表現に関する操作では、デフォルトで $_ という文字列を検索したり変更したりします。この演算子は、そのような操作を他の文字列に対して行うようにします。右辺は、検索パターン (//)、置換
goto553 2009/11/27
正規表現
リンク
Unicodeでの正規表現 - ぱせらんメモ
http://kjirou.sakura.ne.jp/mt/2008/10/python_unicode.html例えば、ユニコード型文字列の内、漢字のみ（"一"〜"龥"）をマッチさせる場合 l = re.findall(u"[\u4e00-\u9fa5]+", "ひらがな漢字カタカナascii".decode("utf-8")) print l[0].encode("utf-8") # -> "漢字" 他の言語と違ってUnicode型というデータ型があるので明瞭極まりない！（from http://kjirou.sakura.ne.jp/mt/） PythonはわからないけどPerlに通じるものを感じたのでPerlでやってみた。まずは上記のコードに似せたパターン。スクリプトファイルはUTF-8で作成。 use strict; use warnings; use Encode; my
goto553 2009/11/26
perl

unicode

正規表現
リンク
MODULE.JP - 日本語に絡むUnicodeブロックとスクリプト(正規表現)
といった感じ。ちなみにjava.util.regexとPerlのUnicodeブロックは接頭子Inを使うが、.NETの場合は接頭子Isを使う、という差異があります。 Unicodeスクリプトとブロックの違いがビミョーに見えるけど、ブロックがコードブロックをゴリッと指定したものに対して、スクリプトは特定言語に関係する文字の種類を直接指定するものなのでブロックよりも断定的、って感じで見れば良かなと。ちなみにUnicode関連のドキュメントによるとUnicodeプロパティとスクリプトで日本語の文章を表そうとすると m/(?:(?:\p{Hiragana}|\p{Katakana}|\p{Han}|\p{Latin}|\p{Common}) (?:\p{Inherited}|\p{Me}|\p{Mn})?)+/x; こんな感じになるそうな。実際流通している文章はこれより多様なので現実とは微妙に乖離
goto553 2009/11/26
unicode

perl

正規表現

ブロック

block

property
リンク
すべての漢字を取り出す正規表現 - totonのブログ
http://www.unixuser.org/~euske/doc/python/sample.py.html # 日本語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html ［亜-煕］はJIS漢字を検出するときに使う正規表現になります。本文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので，すべての漢字を検出するには，[一-龠]を使用してください（龠は音読みで「ヤク」，訓読みで「ふえ」，Unicodeでは「9FA0」にあたります）。追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。
goto553 2009/11/26
日本語

正規表現

perl

unicode
リンク
その場で動作させて確認する正規表現入門ツール「HiFi RegExp Tool」:phpspot開発日誌
HiFi RegExp Tool - Write and Test Regular Expressions in Real-Time その場で動作させて確認する正規表現入門ツール「HiFi RegExp Tool」ボックスの中に、正規表現を入れるだけで、リアルタイムにページの内容が正規表現に沿ってマッチング＆ハイライト表示され、どの正規表現がどういう意味を表すのかというのが一目で超クイックに分かってしまう便利ツールです。ボックスに入れられた正規表現に沿って次のように、ハイライト表示されて、カラフルに色分けしてくれます。マッチしたテキストの一覧もページ下部に色付きで分かりやすく表示してくれます。ページ内のテキストはクリックすることで自由に書き換えることも可能です。サイドバーには正規表現のチートシートも掲載されています。これはかなり便利。正規表現入門の高速道路ですね。
goto553 2009/10/26
正規表現
リンク
Perlの謎（その８）：正規表現 - 小池啓仁ヒロヒト応援ブログ By はてな
今回の謎は、正規表現です。はじめての人のために解説をしてみました。他言語からの人は、正規表現を使う機会がなかったかもしれませんが･･･。 Perlでは、正規表現を使うための言語と言っても過言ではありません。正規表現を使うことによりテキスト（文字列）編集処理が飛躍的に楽になるのです。そもそも正規表現は、人体の神経回路網を数学的に説明するための方法として開発されました。その後、UNIXのケン・トンプソンによってコンピュータでの検索アルゴリズムに引き継がれました。ちなみに、正規表現を初めて使用したアプリケーションは、UNIX のエディタedやexの祖となったQEDというエディタのようです。QED、ed、grep等を経てPerlに引き継がれたようです。（そもそもの正規表現は、参考リンクのリンク先を参照しました）では、まずはじめにテストデータ、family.txt を用意します。このテ
goto553 2009/07/18
正規表現

perl
リンク
JavaScript正規表現メモ。 (JavaScriptでよく使う書き方。) - こせきの技術日記
タイトル変えました。旧タイトル「JavaScriptでよく使う書き方」。よく使うけど毎回忘れる。正規表現にマッチするかどうか。 RegExp#testを使う。 /abc/.test("abcdefg") // => true String#searchはマッチした位置を返す。マッチしない場合は-1。先頭にマッチすると0でfalseなので注意。真偽値が欲しい場合はString#searchを使わない。 "abcdefg".search(/xxx/) // => -1 "abcdefg".search(/def/) // => 3 "abcdefg".search(/abc/) == false // => true 正規表現の部分マッチを得る。部分マッチを得るには、RegExp#execかString#matchを使う。execとmatchの速度は大して変わらない。正規表現のベンチマー
goto553 2009/06/01
正規表現

javascript

js
リンク
へぼへぼCTO日記 - 主要CPANモジュールのメールアドレスの正規表現
use strict; use Encode; use Em ail::Address; use Em ail::Valid; use Em ail::Valid::Loose; use Em ail::Find::addrspec; my $wsp = '[\x20\x09]'; my $vchar = '[\x21-\x7e]'; my $quoted_pair = "\\\\(?:$vchar|$wsp)"; my $qtext = '[\x21\x23-\x5b\x5d-\x7e]'; my $qcontent = "(?:$qtext|$quoted_pair)"; my $quoted_string = "\"$qcontent*\""; my $atext = '[a-zA-Z0-9!#$%&\'*+\-\/\=?^_`{|}~]'; my $dot_atom_text = "$at
goto553 2009/03/22
正規表現

perl

cpan
リンク
tokuhirom blog
Blog Search when-present<#else>when-missing. (These only cover the last step of the expression; to cover the whole expression, use parenthesis: (myOptionalVar.foo)!myDefault, (myOptionalVar.foo)?? ---- ---- FTL stack trace ("~" means nesting-related): - Failed at: ${entry.path} [in template "__entry.ftlh" at line 3, column 25] - Reached through: #include "__entry.ftlh" [in template "entry.ftlh" at
goto553 2009/03/22
正規表現

perl

cpan

validate
リンク
「かなり使えるPHPの正規表現まとめ」にツッコんでみる。 - あそことは別のはらっぱ
かなり使えるPHPの正規表現まとめに404 Blog Not Found:「PHP使いはもう正規表現をblogに書くな」と言わせないでくれがDisかまして、まあほどよく荒れているわけですが。 Idea*Ideaの中の人も既に突っ込まれているのに「個人的にまだ検証していないのであれですが」なんていいながら次のエントリを書いてますし、たぶん修正する気がないんだな、ということで、あの正規表現にツッコミをいれてみようと思います。ちなみにはてなブックマークのほうでは、perlの正規表現とPHPの正規表現が違う(ゆえにperlでの例を見てもPHPの参考にならないのでは?)、と思っている人がいるみたいですが、今どきのPHPとperlであれば、正規表現に差はほとんどないです。差があるとしても、間違ったマッチを書くよりは少ない差です。あと、これはブクマコメントにも要旨として書いたのですが「正規表現がいく
goto553 2009/03/21
正規表現
リンク
regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found
2009年03月09日00:30 カテゴリLightweight LanguagesTips regexp - ^$でなくて\A\zを使おうまずは回答から。正規表現で「制御文字以外」のチェック - ockeghem(徳丸浩)の日記文字エンコーディングの妥当姓制御文字(\x00〜\x1f, \x7f)のチェック文字列長のチェックこのうち後ろ二つを正規表現として書くにはどうすればいいかを考えていました。こういう時には、「全文字がOKならOK」と考えるのではなく、「一文字でもNGならNG」と考えると楽になります。それは「スペースと非制御文字以外」なのですから、/[^ \S]/が求めていた正規表現で、=~ではなく!~が使うべき演算子ということになります。全角スペースもOKにしたければ、/[^ \x{3000}\S]/。[追記参照] [Run via Codepad] #!perl -
$regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found$
goto553 2009/03/09
制御文字

正規表現
リンク
1