タグ

正規表現に関するteitei_tkのブックマーク (4)

  • Pythonでの正規表現の簡単なまとめ - minus9d's diary

    Pythonでの正規表現の使い方を勉強した。Perlの正規表現とパターンの書き方はほぼ同じのようだけど、その他の部分はかなり違っている。あまり良いページが見つけられなかったので、正規表現 HOWTO — Python 3.3.3 ドキュメントを読んで簡単にまとめた。 この記事の想定読者は、他言語で正規表現を扱ったことのある人。したがって正規表現のパターンの書き方についてはこの記事の対象外。正規表現のチュートリアル的な記事が読みたければ、Python3なら正規表現 - Dive Into Python 3 日語版、Python2ならChapter 7. Regular Expressions(英語)が良いと思う。 基 re.compile()を用いて、あらかじめ正規表現のパターンをコンパイルする。例えば、「3で始まり7で終わる最短の文字列」を探すためのパターンは以下のように書ける。 文字

    Pythonでの正規表現の簡単なまとめ - minus9d's diary
  • プログラミング言語における正規表現リテラルの必要性について

    Twitterに書いたことのまとめです。 プログラミング言語の仕様の一部として正規表現リテラルを提供することの得失について、JavaScriptを例に説明します。 ■より簡潔なコード 言うまでもありませんが、正規表現リテラルを使った方が簡潔なコードになります。 (new RegExp("abc")).exec(s) // リテラルを使わない場合 /abc/.exec(s) // リテラルを使った場合 また、正規表現リテラルがない場合は、文字列リテラルとしてのエスケープと正規表現としてのエスケープが二重に必要になる結果、コードの保守性が低下します注1。 new RegExp("\\\\n"); // リテラルを使わない場合 /\\n/ // リテラルを使った場合 ■エラー検出タイミング 正規表現リテラルがない場合、実際にその正規表現が評価されるまで記述エラーを検出することができません。正規表

  • 字句解析 - Wikipedia

    計算機科学における字句解析 (じくかいせき、英: lexical analysis) とは、ある言語で書かれた文について、その文字の並びを解析し、言語的に意味のある最小の単位(トークン)に分解する処理のこと[1]。 字句解析は、コンピュータを用いた自然言語処理でも、プログラミング言語のコンパイルでも行われる[1]。 自然言語の文であれ、プログラムのソースコードであれ、文というのは結局、文字や記号や約物類が多数並んだもの(文字列)であるが、字句解析はそれを、言語的に意味のある最小単位トークン(英: token(s))に分解する処理である。 文を解析してトークンに分解する作業を自動的に行うプログラムを字句解析器(英: lexical analyser)という。

  • PHP: PCRE のパターン - Manual

    Getting Started Introduction A simple tutorial Language Reference Basic syntax Types Variables Constants Expressions Operators Control Structures Functions Classes and Objects Namespaces Enumerations Errors Exceptions Fibers Generators Attributes References Explained Predefined Variables Predefined Exceptions Predefined Interfaces and Classes Predefined Attributes Context options and parameters Su

  • 1