[B! 正規表現] cnomiyaのブックマーク

cnomiya id:cnomiya

正規表現に関するcnomiyaのブックマーク (15)

gkbr.me
cnomiya 2010/11/15
正規表現

メールアドレス
リンク
gkbr.me
cnomiya 2010/11/15
正規表現

URL
リンク
gkbr.me
cnomiya 2010/11/15
正規表現

全角
リンク
Narcissus の正規表現: Days on the Moon
「前のエントリで書き忘れてた - 最速チュパカブラ研究会」にて、Narcissus で使われている正規表現が参考になるという話が出ています。文字列リテラル /^"(?:\\.|[^"])*"|^'(?:[^']|\\.)*'/ 正規表現リテラル /^\/((?:\\.|[^\/])+)\/([gimy]*)/ コメント /^\/(?:\*(?:.|\n)*?\*\/|\/.*)/ 一流の人が書いたものを使いましょうというのに異を唱えるつもりはありませんが、そのままコピー & ペーストしていては意味がありません。ここはやはり一文字一文字心をこめて写経しましょう……ではなく、どうしてその書き方でうまくいくのかをきちんと考えた上で使いましょう。文字列リテラルにマッチする正規表現上記の文字列リテラルを表す正規表現から、一重引用符でくくられた文字列にマッチする部分だけを抜き出すと '(?:[^
cnomiya 2008/05/23
正規表現

javascript
リンク
AJAX Reguler EXpression eValuator
EnglishBulgarian
cnomiya 2008/03/26
ajax

プログラミング

正規表現
リンク
404 Blog Not Found: get($one) if $you =~ /regexp user/;# 書評 - 入門正規表現
2008年03月07日00:00 カテゴリ書評/画評/品評Lightweight Languages get($one) if $you =~ /regexp user/;# 書評 - 入門正規表現技術評論社書籍編集部池本さんより献本御礼。入門正規表現岩谷宏初出2008.03.05;販売開始まで掲載 404 Blog Not Found:書評x3 - SQL 本三大対決言語内言語としてこれだけ使われるようになったSQL。そうするともう一つの言語内言語、正規表現が気になる。しかしこちらの方はSQLと違って、現在のところ「フクロウ本」の一人勝ちのように思える。誰か書かない? キタコレ！それも想定の範囲内の出版社と、想定の範囲外の著者の組み合わせで。本書「入門正規表現」は、タイトルどおりの本。正規表現に関しては今まで「フクロウ本」こと「詳細正規表現」がほぼ唯一の選択肢だったが、原著も訳
cnomiya 2008/03/06
dankogai

regexp

regex

正規表現
リンク
regexp - 全角英数字を半角に : 404 Blog Not Found
2008年01月14日03:30 カテゴリLightweight Languages regexp - 全角英数字を半角にきっかけは、はてなハイク。自分と根本的にあわない人 - fmht7 - はてなハイク PCで英数字をダブルバイトで入力する人禿同、しかし人を憎みたくなかったので。 Perlではお茶の子さいさい。 perl - dankogai - はてなハイク perl -CIO -ple 'tr/\x{FF01}-\x{FF5e}/\x21-\x7e/' は脊髄でひねり出せた。どうせならJavaScriptでもやってみよう、ということでひねり出したのがこちら。！釤＃＄％＆釻（）＊＋，−．／０１２３４５６７８９：；＜＝＞？＠ＡＢＣＤＥＦＧＨＩＪＫＬＭＮＯＰＱＲＳＴＵＶＷＸＹＺ［＼］＾＿｀ａｂｃｄｅｆｇｈｉｊｋｌｍｎｏｐｑｒｓｔｕｖｗｘｙｚ｛｜｝〜 var fasci
cnomiya 2008/01/15
dankogai

javascript

正規表現
リンク
ファイルの先頭8バイトだけで画像のフォーマットを調べる - bits and bytes
PHPでファイルをアップロードしたとき $_FILES にアップロードされたファイルについての情報が入っています。そして $_FILES[...]['type'] にはアップロードされたファイルの MIME type が入っています。しかしここに入っている値は PHP: ファイルアップロードの処理 - Manual に $_FILES['userfile']['type'] ファイルの MIME 型。ただし、ブラウザがこの情報を提供する場合。例えば、"image/gif" のようになります。この MIME 型は PHP 側ではチェックされません。そのため、この値は信用できません。と書かれている通り信頼できません。ソースコードを見てみると php-5.1.4/main/rfc1867.c の SAPI_API SAPI_POST_HANDLER_FUNC(rfc1867_post
cnomiya 2007/05/21
画像

正規表現
リンク
Perlメモ
複数のプロセスでロック状態が異常であると判断し，そのうちの 1つがロックを解除したことにより，別のプロセスがロックしたにもかかわらず，先ほどロック状態が異常であると判断したプロセスによってこの正常なロックを解除されてしまう可能性があります．この方法の問題点は，異常なロック状態を解除する操作が正常なロック状態をも解除できてしまうことにあります．逆に言えば，異常なロック状態を解除する操作によって正常なロック状態を解除できなければ問題ないわけです．そのためにはどうすればよいのか？答えはロック状態が常に変化していけばよいということです．そして，これを実現するのに都合がよいのが rename による方法になります．最初のスクリプトで説明しますと，ロックファイルが lockfile という名前のときがロックが解除されている状態で，lockfile987654321 のように後ろに
cnomiya 2007/03/14
正規表現
リンク
SBP：結城浩の「Perlクイズ」コンマをつける
(陽丘（ひおか）さん) 目指せ最速ぅ〜. foreach (@numbers) { s!(\d+)! my $d = ' 'x((3-length($1))%3).$1; $d =~ s/\s\s(\d)|\s(\d\d)|^(\d\d\d)|(\d\d\d)/$4?",$4":"$1$2$3"/eg; $d; !eg; print $_, "\n"; } はい、みごと今回の最速の正解者でした。パチパチ。ははあ、なるほど3桁ずつ区切りやすくするために頭にスペースをくっつけて3の倍数の長さにしたのですね。なるほど。 $4 ? ",$4" : "$1$2$3" の部分は「先頭以外の\d\d\dがあったらコンマをつける、それ以外は…」というロジックなのですね。何だかすごいですね。 (加来敦史（かくあつし）さん) こんにちは、初めて解答させていただきます。このメルマガは、かなり初期のころ
cnomiya 2007/03/14
正規表現
リンク
Web系雑記: JavaScriptで3桁区切りのカンマ
(11/15)HTML5プロフェッショナル認定試験レベル1に合格しました (11/08)Windows10でエクスプローラーで開いてるフォルダをコマンドプロンプトで開くのが楽になった (02/16)CatalystでスタックMACアドレスの扱いが機種ごとにどう違うか (02/02)もう一つのSDN? Simple Defined Networkingとは (02/02)RealtekのNICでタグVLANのタグをパケットキャプチャで確認する (11/06)Windows標準で使用できる正規表現対応エディタとして「PowerShell ISE」という選択肢 (09/09)OpenFlow超初心者が最初の1週間で読んだ本たち (08/21)Catalystのdefineコマンドを使ってみた一般(75) (X)HTML+CSS(5) JavaScript(12) UI・デザイン(6) Unix
cnomiya 2007/03/14
正規表現
リンク
【インフォシーク】Infoseek ：楽天が運営するポータルサイト
日頃より楽天のサービスをご利用いただきましてありがとうございます。サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。メンテナンスが終了次第、サービスを復旧いたしますので、今しばらくお待ちいただけますよう、お願い申し上げます。
cnomiya 2007/03/09
正規表現

プログラミング
リンク
「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う:phpspot開発日誌
Information Flow and Stock: [PHP] mb_ereg()じゃない、preg_match_all()に/uをつけるんだ！なので、できる限りpreg系の関数を使いたいわけですが、検索対象や検索パターンに日本語が含まれているときは、日本語処理に対応したereg系の関数であるmb_ereg系の関数が使われることが多いようです。以前、「すべての漢字を取り出す正規表現」をPHPで試す、を正しく行う方法。以前はmb_eregによる方法を示しましたが、次の方法の方がうまく動作するようです。 preg_match_all('/[一-龠]+|[ぁ-ん]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[ａ-ｚＡ-Ｚ０-９]+/u', $strToSplit, $aMatches); print_r($aMatches); // マッチ結果が全出力確かに、なぜか取れない漢字があ
cnomiya 2006/12/13
正規表現

漢字
リンク
「すべての漢字を取り出す正規表現」をPHPで試す:phpspot開発日誌
すべての漢字を取り出す正規表現を参考にPHPでトークンを切り出すサンプルを作成しました。 <?php // スクリプトはUTF-8で記述されています $str = <<<EOM ようこそphpspotへ！当サイトではフリーのwindows用php開発環境であるＰＨＰエディタ forWin や、フリーのＰＨＰスクリプト( PHP 掲示板,webshot,webimager,CMS 等 )、ＰＨＰツールバー、テレビバー、便利検索バー(Yahoo,Google,辞典検索)などを配布しています。その他、ＰＨＰ入門やＰＨＰ５ーＴＩＰＳ、ＰＨＰサンプル集、MySQL解説、ＰＨＰレンタルサーバー特集などのコーナーもあります。 EOM; mb_internal_encoding("UTF-8"); mb_regex_encoding("UTF-8"); $token = array(); // すべての
cnomiya 2006/12/13
正規表現

漢字
リンク
すべての漢字を取り出す正規表現 - totonのブログ
http://www.unixuser.org/~euske/doc/python/sample.py.html # 日本語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html ［亜-煕］はJIS漢字を検出するときに使う正規表現になります。本文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので，すべての漢字を検出するには，[一-龠]を使用してください（龠は音読みで「ヤク」，訓読みで「ふえ」，Unicodeでは「9FA0」にあたります）。追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。
cnomiya 2006/12/13
正規表現

漢字
リンク
1