タグ

正規表現に関するtsuyossiiのブックマーク (37)

  • 漢字、ひらがな、カタカナにマッチさせる方法 | 正規表現

    Unicodeプロパティがサポートされない場合 文字クラスで、文字が定義されているコードの範囲を指定します。このときShift_JISなどの[亜-熙]では不十分で、Unicodeブロックの範囲を指定する必要があります。 ひらがな Hiragana (Unicode block) - Wikipedia 表記1 … [\u3041-\u3096] 表記2 … [\x{3041}-\x{3096}] カタカナ Katakana (Unicode block) - Wikipedia 表記1 … [\u30A1-\u30FA] 表記2 … [\x{30A1}-\x{30FA}] 表記1 … [々〇〻\u3400-\u9FFF\uF900-\uFAFF]|[\uD840-\uD87F][\uDC00-\uDFFF] 表記2 … [々〇〻\x{3400}-\x{9FFF}\x{F900}-\x{FA

  • タグ付き正規表現―秀丸エディタの正規表現

    タグ付き正規表現 タグ付き正規表現は置換で使います。 正規表現にタグと呼ばれる特殊な記号(メタ文字)を埋め込み、検索時に指定した正規表現のパターンを保持したまま、順番を入れ替えたりする場合に使用します。。 このタグはどの部分を取り出すか?という範囲を指定するために使われます。 タグ付き正規表現を使いこなすためには、文章の構造を正規表現を用いて抽象的に表記する事が必要になります。 文章を正規表現を用いて抽象的に表記する 以下の事例で実際にやってみましょう。 置換前 この二行は、いずれも一行毎に詠み手水平tab歌の構造を持っています。 この構造を、タグ付き正規表現を利用して歌改行詠み手に変えてみましょう。 この文章は上に書いたとおり、一行が詠み手水平tab歌の構造を持ちます。 とりあえず、詠み手と歌の間に水平tabを表す¥tが入るのはわかるかと思います(わからなければ、エスケープシーケンスと正

  • 正規表現サンプル集

    正規表現とは 「正規表現」とは、「検索」や「置換」で指定する文字列をパターン表現する方法で、プログラミング言語やテキストエディタなどで利用できます。 正規表現には、「パターンを表現するための記号=メタ文字」が多数用意されており、それらを組み合わせることで、「aから始まる英単語」「3桁の数字」「行頭の2文字」といった柔軟な文字列を指定することができます。 ※正規表現にはプログラム言語やテキストエディタなどにより「方言」があり、メタ文字や記述方法が異なります。 このページでは「Perl」タイプの正規表現をご紹介しています。 基のメタ文字 正規表現には記号(メタ文字)がたくさんありますが、ここでは、基中の基といえるメタ文字をいくつかご紹介します。 頻繁に利用するメタ文字なのでぜひ覚えてください。 ※以下、赤字がメタ文字です。 <…または…> 「または」の対象が1文字の場合は、[ ]内にその

  • 正規表現の文字クラスまとめ - 名もないテクノ手

    先日、Yuji@勉強部屋さんと電話で話していて、文字クラスの理解が正規表現の「一里塚」だなぁ、と感じました。InDesignで初めて正規表現に接する方も多く、戸惑われている人もいらっしゃると思います。 文字クラスは正規表現の中でもちょっと特別な存在です。文字クラス内だけで使えるメタ文字や、位置によって意味が変わるメタ文字もあります。文字クラスについては、日頃使い慣れた人でも間違えやすい部分もあり、結構奥が深いのでおさらいの意味も込めてまとめておきます。 文字クラスの基 ここで言う「文字クラス」は、「POSIXブラケット表現」とも呼ばれます。違うサイトや書籍などで、これらの用語が混在することがありますが、ほぼ同じと考えて差し支えありません*1。 文字クラスは任意の1文字にマッチする「文字集合」を表現できます。 簡単な例から見てみましょう。たとえば「お母さん」と「お父さん」のどちらにもマッチ

    正規表現の文字クラスまとめ - 名もないテクノ手
  • 完全一致・前方一致・後方一致

  • パターンマッチ演算子の区切り文字を指定する

    パターンマッチ演算子を使ってパターンを記述する場合、「/パターン/」または省略せずに記述する場合は「m/パターン/」と記述します。この場合区切り文字として「/」を使用していますが、別の記号を区切り文字に使用することもできます。ここでは Perl の正規表現でパターンマッチ演算子を使用するときの区切り文字を指定する方法について解説します。 ※ パターンマッチ演算子の基的な使い方については「パターンマッチ演算子を使ったパターンの記述」を参照されてください。

    パターンマッチ演算子の区切り文字を指定する
  • 正規表現 - SMART 開発者のためのウェブマガジン

    正規表現の概要 正規表現は、Perlの中で最も重宝する機能のひとつです。正規表現にはテキスト処理のための様々な機能があり、文字列の中から特定のパターンを見つけ出したり、置換したりすることができます。 正規表現の基的な使用方法 たとえば、$strという変数に格納したデータの中から、「A」で始まって途中は何があるかわからないが最後が「E」という文字列を探したい場合、次のように記述することで、条件にマッチする文字列を見つけることができます。 $str =~ /A.*E/; 上記では、ドット( . )が改行以外の1文字を表し、アスタリスク( * )がその任意の文字の0回以上の繰り返しを意味します。このように、正規表現において特殊な働きを持った文字を正規表現演算子、またはメタ文字と呼びます。また、=~ はパターン結合演算子と呼ばれ、「左辺の値から右辺の値を検索する」という意味があります。 正規表現

    正規表現 - SMART 開発者のためのウェブマガジン
  • 正規表現サンプル集

    « 前 1 2 次 » 検索したい文字列 ※クリックで詳細説明に移動 正規表現 ※赤い字がメタ文字、グレーの「\」はエスケープのための「\」 JAPAN、NIPPONを日に置き換える

  • 第7章 正規表現

    正規表現とは、ある特定の文字列ではなく、文字列の一部をパターン化して表現する手法をいいます。 複数行ある文章の中から文字列を検索する時に、検索したい文字列すべてを指定するのではなく、文字列の任意の一部を置き換え可能な状態にして検索をする場合に正規表現を用います。 たとえば、UNIXやWindowsでは、文字列を検索するときに使用される正規表現として、「*」を任意の文字列(空き文字も含む)に、「?」を任意の1文字として使用することができます。パターンを、app* と表現すると、 apple application appeal などの文字列がマッチすることになります。 この正規表現の方法は、当然ながらプログラム言語ごとに異なりますが、Perlの場合は他の言語に比べて非常に強力な正規表現によるパターンマッチ機能を備えており、より詳細にかつ容易にパターンマッチを行うことができるとされています。

  • ★★★CGI-Perl 基礎編 (その八) 正規表現、マッチパターン、置換演算子、変換演算子 - SAK Streets

    CGI-Perl 基礎編 (その八) 正規表現、マッチパターン、置換演算子、変換演算子 ■正規表現 ・過去扱ってきた言語に正規表現などと言うものは存在しなかった。 上手く使うと非常に便利である。(パターンマッチ、パターンマッチング) 以下、簡単にまとめておく。 ■マッチパターン演算子 i 大文字、小文字の区別なし s 単一行として処理 (^、$ は、\n を無視) m 複数行として処理 (^、$ は、行先頭、行末尾) x 空白を無視、# をコメント処理 ■メタ文字 . 改行を除く任意の 1 文字 * 0 回以上のパターン繰り返し + 1 回以上のパターン繰り返し ? 0 または 1 回のパターン ^ 先頭から $ 末尾から \ メタ文字クォート | パターン論理和 () パターングループ [] 文字クラス {} 量指定子 \n 改行 文字クラスでも指定可 \r キャリッジリターン 文字クラ

  • Perl正規表現雑技

    このページは Perl5.6 を対象としています. perl スクリプトは EUC-JP で書かれることを想定しています. このページは 正規表現メーリングリスト を参考に,私が独自にメモとしてまとめたものです. このページの正規表現やスクリプトについての詳しい説明, わかりやすい説明はおそらくできません. このページに書かれているスクリプトは, 個人の責任において実行してください. このページに書かれているスクリプトの 利用・改造は自由 です. その際はどこかにこのページの URI( http://www.din.or.jp/~ohzaki/regex.htm )を参考として記述していただければ幸いです(任意). ご意見・ご感想・ご要望などは にお願いします.こう書いた方がいい, 動かん,わからん,バグってる,これ書け,などなどお待ちしています. このページへの リンクは自由 に張ってく

  • Perlメモ

    複数のプロセスでロック状態が異常であると判断し,そのうちの 1つがロックを解除したことにより,別のプロセスがロックしたにもか かわらず,先ほどロック状態が異常であると判断したプロセスによってこの正常なロッ クを解除されてしまう可能性があります. この方法の問題点は,異常なロック状態を解除する操作が正常なロック状態をも 解除できてしまうことにあります.逆に言えば,異常なロック状態を解除する操作に よって正常なロック状態を解除できなければ問題ないわけです.そのためにはどうす ればよいのか? 答えはロック状態が常に変化していけば よいということです.そして,これを実現するのに都合がよいのが rename による方法になります. 最初のスクリプトで説明しますと,ロックファイルが lockfile という 名前のときがロックが解除されている状態で,lockfile987654321 のよう に後ろに

  • Perlの正規表現をマスターしよう - Perl入門ゼミ

    Perl › 正規表現 Perlの正規表現の解説です。この記事を読めば、日常で利用する正規表現のすべてを短時間でマスターすることができます。正規表現を使えば、文字列の集合を表現することができ、正規表現にマッチする文字列を検索したり、置換したりすることができます。 正規表現を使って文字列の集合を表現できます。たとえば「a」「aa」「aaa」という三つの文字列を正規表現で表現してみましょう。連続する文字の個数を表現する正規表現「{}」を使って次のように書くことができます。 a{1,3} 「a」「aa」「aaa」という文字列の集合をひとつの正規表現「a{1,3}」で表しています。{}は量指定子と呼ばれるもので、連続した文字を表現することができます。 a aa -> a{1,3} aaa 正規表現の例をもう一つみてみましょう。「p1」「q1」「r1」という文字列の集合をひとつの正規表現「[pqr]

    Perlの正規表現をマスターしよう - Perl入門ゼミ
  • サルにもわかる正規表現入門

    1.正規表現とはなにか? 端的に言えば、「いくつかの文字列を一つの形式で表現するための表現方法」です。 では、なぜこの表現方法が有名なのかといえば、この表現方法を利用すれば、たくさんの文章の中から容易に見つけたい文字列を検索することができるためです。 この形式を使えば、以下のようなコギャルの会話にもついていけます(^_^) 「Windows ってあって…WINDOWSかもしんないしぃ、次にスペースが入ってるかもしんないしぃ、入ってないかもしんないし、後にやっぱ 98 が付くってゆーかー、もしかすると 95 が付いてもいいかなぁって感じでぇ…」 これ以上続けるとこちらがキレてしまいそうなのでこのあたりにしておきますが…これは、正規表現で書くと… W(indows|INDOWS) ?9[85] って感じで一行で書けちゃうっていうかぁ…あ、つい、口調が移ってしまった(^_^;)…書けるのでありま

  • Dearie is under construction

    Thank you for being patient. We are doing some work on the site and will be back shortly.

  • 秀丸エディタを使いこなす 正規表現

    正規表現とは? とは「一定のパターンで表記されている文字列を、抽象的な表記法に置き換えて表現する方法」を指します。 例えば、このような例があります。 行頭を一文字字下げしたい よくある処理方法 各行の頭にカーソルを移動して一文字下げる(…以下全ての行に繰り返し実行) 正規表現を利用した処理方法 検索キーワードにを意味する正規表現を指定 置換キーワードに「全角空白」を指定 をに置換→行頭に全角空白が挿入 正規表現は、上の事例のような定型的処理を大量かつ高速に実行したい場合に威力を発揮します。また、その理論上処理漏れ(上の事例の場合では字下げ忘れ)も発生しません。 他にも、以下のような場合で正規表現が有効になります。 (句点)の後で必ず改行したい 「文の注釈表記+番号」を一度に削除したい HTML文書のマークアップ(タグ)だけを削除したい 行頭の特定パターン文字(例:行頭の字下げに挿入した空

  • 秀丸エディタQ&A集: 第Ⅳ部 - テキスト編集を極める!! 正規表現について

    第IV部〜テキスト編集を極める!! 正規表現について ●正規表現について 秀丸だけでなく、高度で自由度の高い検索をするには必須の「正規表現」。 ここでは実用上重要な例をとりあげながら、わかりやすく解説します。 今日からあなたの「検索」が変わります。 正規表現に関する話題は、 次の「【0】いんとろだくしょん」に続く 以下の5章から構成されています。 【1】 基編 〜表記のルールと意味〜 【2】 実践編 〜正規表現による置換の実際〜 【3】 まとめ 【4】 参考文献 【5】 (補足) 秀丸上での複数行にまたがる検索について ※以下の内容は、秀丸ヘルプの「検索系コマンド→検索→正規表現」の 内容についての補足です。 よってヘルプを参照しながら読まれる事を想定して書かれています。 【0】 いんとろだくしょん いきなりですがここでクイズです。

    tsuyossii
    tsuyossii 2009/09/04
     めっちゃ笑えて、めっちゃわかりやすいです。