タグ

正規表現に関するwalk77のブックマーク (8)

  • perlre - Perl の正規表現

    Perl5 perlre - Perl の正規表現 [DESCRIPTION][正規表現][Version 8 正規表現][FAQやTIPS] 正規表現 パターンマッチで用いるパターンは、Version 8 regexp ルーティ ンで提供されているような正規表現です。 (実際、使用している ルーティンは、Henry Spencer が書き直した再配布可能な V8 の ルーティンを元にしています。) 詳しくは、「Version 8 正規表 現」の節を参照してください。 特に、以下のメタ文字は、標準的な egrep(1) と同様の意味を表わ します: \    次のメタ文字をクォートする ^    行の最初にマッチする .    (改行以外の) すべての文字にマッチする $    行の終わりにマッチする |    選択 ()    グループ化 []    文字クラス デフォルトでは、文字 "

    walk77
    walk77 2013/12/13
    > \L    \E まで小文字にする > \U    \E まで大文字にする
  • 正規表現で一致した文字列を取得し、置換のときに再利用する | mkacky

    【やりたいこと】 テキストエディタの検索やsedなど正規表現を扱うことができるパターンマッチングで,マッチした文字列をそのまま再利用する。 【実現方法】 ・検索・マッチング時に取得したい範囲を“\(“と”\)”で,パターンをくくる。 ・一致した文字列は“\1″,”\2”で取得する。 【注意】 UNIX由来の古い正規表現らしい。 Wikipediaの正規表現のページを参照されたい。 【例】 ・fugaという文字列の文頭だけを大文字する。さらに前後に文字列(Hoge,Piyo)を付け足す。 $ echo fuga | sed -e “s/^\(.\)\(.*\)/Hoge\U\1\E\2Piyo/” 【結果】 HogeFugaPiyo 【解説】 sed sed -e “s/置換前文字列/置換後文字列/” 対象となる文字列 今回は「対象文字列」はパイプから渡された”fuga” ^ 文字列の先頭

    正規表現で一致した文字列を取得し、置換のときに再利用する | mkacky
    walk77
    walk77 2013/12/13
    > \U, \E この2つの制御文字で挟まれた部分を大文字に変える
  • 図解でみる正規表現入門

  • ワイルドカードと正規表現

  • 図解でみる正規表現入門  part31 - 文字列 の 否定

    正規表現 否定 文字列前のページ    次のページ いろいろな環境の中には、先読みの否定である (?! ) が 使えない環境があります。 このような環境では、 「ABC」 という文字列を含まない というような、文字列の否定をする正規表現を作るのは とても難しい作業になります ※ (?! ) が使える環境での作り方は こちら 。 では、例として、 以下のようなテキストにマッチする正規表現を考えてみましょう★ ・ テキストの先頭が AA から始まる ・ テキストの末尾が AA で終わる ・ 先頭の AA と、末尾の AA との間に挟まれた文字列の中には  AA が存在しない ちなみに、 "AAAAA" というテキストの場合、中に挟まれた文字列が  A の1文字だけなので、マッチするものとします ▽ マッチさせたいテキストの図 このような場合、 まず、以下のように正規表現に使えそうなパーツを書き

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

    walk77
    walk77 2013/10/29
    \p{Cntrl} 制御文字: [\x00-\x1F\x7F]
  • gensub でのグループ化と置換 - 日本 GNU AWK ユーザー会 0.2

    元はこちらです。 awk で正規表現のグループ化(Pythonで言うとm.group(1)とか、あれ)があるかないかが良く分からん。ちょっと調べた限りだとないように見える。普通の人はそこまでやったら普通sedか何かなんだろうか 2007/10/28 の出来事 - 真 もわ爛漫 Python の m.group とも違っているような気がしますし、あまり私も使用いているわけではありませんが、コメントさせていただきました。 以下のようなものでいいのでしょうか? (それすら曖昧で申し訳ありません) $ echo 'abcdefg' | gawk '{print gensub(/(ab).+(fg)/, "\\2 \\1", "g")}' fg ab詳細は 8.1.3 文字列操作関数 の gensub() のところに書かれています。

    gensub でのグループ化と置換 - 日本 GNU AWK ユーザー会 0.2
  • GNU Awk ユーザーズガイド: General Introduction

    General Introduction このファイルは、ファイルから特定のレコードを選び出すことに使ったりそれ らを操作することができるプログラム awk について記載したもの である。 Copyright © 1989, 1991, 1992, 1993, 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2007 Free Software Foundation, Inc. これは AWK の GNU による実装の 3.1 .6 (ま たはそれ以降) のバージョン用の GAWK: Effective AWK Programming : GNU Awkのためのユーザーズガイド の3 版である。 複製は許可されており、Free Software Foundation によって発行されている GNU Free Docu

  • 1