タグ

ブックマーク / www.kt.rim.or.jp/~kbk (3)

  • 正規表現メモ

    \x{} \pは後続する名前が表すクラス(プロパティ、スクリプト、ブロック)に属する文字にマッチし、 \Pは後続する名前のクラスに属さない文字にマッチします。 クラスの名前が一文字のときはブレースを省略できます。 クラス名の前に^を置くことにより否定形の指定を行うことも可能です。 Perl 5.8 での変更点 Perl5.8以降(5.6でも使えたようですが)では \pや\Pで始まるプロパティ指定に標準Unicode属性を使うこともできます。 詳しくは perlunicode perlunicode - Perl における Unicode サポート を参照してください。 日語による説明が Unicodestandard にもあります。 Perl 5.8以降ではユーザーが任意のプロパティを作成することができます (IsまたはInを必ず前置)。 詳しくは perlunicode perluni

  • The GNU Awk User's Guide - 正規表現

    正規表現とは、文字列の集合を表現する方法である。 正規表現はawkプログラミングにおいて非常に基的な 部分であるので、その書式と使い方は章を分けて説明するに値する。 スラッシュ(`/')に囲まれた正規表現は、その正規表現が示す集合に 属するテキストが含まれる全ての入力レコードにマッチするawkの パターンである。 もっとも単純な正規表現は、文字や数字、もしくはその両方の並びである。 このような正規表現はそのような並びを含む任意の文字列にマッチする。 したがって、`foo'という正規表現は`foo'を含む任意の文字列 にマッチすることになる。 それにより、/foo/というパターンはレコードのどこであっても `foo'という三文字を含む入力レコードにマッチすることになる のである。他の種類の正規表現は、あなたがより複雑な文字列の集合を指定でき るようにするものである。 Initially,

    shuuuuuny
    shuuuuuny 2014/10/17
    awk
  • The GNU Awk User's Guide - Getting Started with awk

    awkの基的な機能は、ファイルからあるパターンを含んでいる行(もし くは他のテキストの構成単位)を検索することである。ある行がパターンの一つ にマッチしたとき、awkは特定のアクションをその行に対して実行する。 awkはこのようにして入力ファイルの最後の行までそれぞれの行を処理し 続ける。 awkのプログラムは他の大部分の言語とは異なっていて、data-driven である。これは処理したいと思うデータについて記述し、さらにそれを 見つけたときにどのようなことをするのかということについて記述する。という ことである。他のほとんどの言語は手続き型(procedural)である。それら においては、事細かに、プログラムの各ステップ毎にどのようにするかを記述し なければならない。手続き型言語を使用しているときは、あなたがプログラムで 処理しようとしているデータがどのような構造をしているかを明確

    shuuuuuny
    shuuuuuny 2014/10/17
    awk
  • 1