タグ

正規表現に関するanpodのブックマーク (3)

  • Office TANAKA - Excel VBA Tips[正規表現によるマッチング]

    VBAから正規表現を使うには、VBScriptが便利です。ただし、正規表現をサポートしているVBScriptはVer5.0からですから、IE5.0がインストールされているパソコンでないと使えません。 VBScriptの中で正規表現エンジンを提供しているのはRegExpオブジェクトです。参照設定によるEarly Bindingか、CreateObject関数を使ったLate Bindingで参照します。ここではLate Bindingによるサンプルを紹介します。 まずは、正規表現で使用するオブジェクトとプロパティやメソッドを整理しましょう。 RegExpオブジェクトのプロパティとメソッド

  • すべての漢字を取り出す正規表現 - totonのブログ

    http://www.unixuser.org/~euske/doc/python/sample.py.html # 日語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html [亜-煕]はJIS漢字を検出するときに使う正規表現になります。 文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので,すべての漢字を検出するには,[一-龠]を使用してください(龠は音読みで「ヤク」,訓読みで「ふえ」,Unicodeでは「9FA0」にあたります)。 追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。

    すべての漢字を取り出す正規表現 - totonのブログ
  • 使うほどに良さが分かる正規表現(1/2)

    最初は訳が分からないが、慣れると大変重宝する。ある意味UNIXの象徴ともいえるのが「正規表現」だ。正規表現をすべて究める必要はないが、知っていると便利なことが多い。 正規表現ってナニモノ? 正規表現というと何やら難しそうですが、要するに文字列を指定する方法です。Windowsではファイル名を指定するとき、複数の文字と一致する「*」、任意の1文字と一致する「?」が使えます。例えば、「拡張子がwavのファイル」だったら「*.wav」とするわけです。Windowsでは、この「*」や「?」を「ワイルドカード」と呼んでいます。これを強化したものが正規表現だと考えればいいでしょう。ただし、柔軟な指定が可能な分だけ複雑になっています。 正規表現を覚えるとどんなときに便利なのか、簡単な例を挙げてみましょう。例えば、きれいに整形されてインデントの付いたテキストファイルをHTML化したいとしましょう。そのまま

    使うほどに良さが分かる正規表現(1/2)
  • 1