正規表現に関するuske_Sのブックマーク (3)

  • ICU の正規表現

    IBM Tivoli Composite Application Manager for Applications バージョン 7.2.1 ICU の正規表現 プログラミング言語が異なると、正規表現を実装する方法も多少異なるため、この情報は、Oracle Database Extended エージェントの正規表現機能を使用する場合に不可欠です。

    uske_S
    uske_S 2020/10/22
    CotEditorで利用している正規表現ライブラリ
  • Unicodeのgrapheme cluster (書記素クラスタ) | hydroculのメモ

    Unicodeのgrapheme cluster (書記素クラスタ) 2015/10/25 Unicodeテキストを1文字ずつ分割するアルゴリズムをUnicodeの仕様として定められており、grapheme cluster (書記素クラスタ)と呼ばれる。 普通はUnicodeのコードポイント1つずつ文字が割り当てられているので、ほとんどはコードポイント1つが1文字になるのだが、たまにコードポイント2つ以上で1文字になるものもあり、 1文字ずつテキストを分解するのは意外と複雑なルールになる。 Grapheme cluster について書かれている公式のドキュメントは以下にある。 Unicode® Standard Annex #29 UNICODE TEXT SEGMENTATION http://unicode.org/reports/tr29/ この記事は公式ドキュメントを読んで理解した

    uske_S
    uske_S 2020/10/22
    書記素クラスタ
  • シェル ( /bin/sh ) での正規表現マッチ。 - それマグで!

    以前、bash の正規表現について書いた。 今回は、今更だけど、あえて、bash/zsh で使われている [[ を使わずに、正規表現を使おうとしてみた。 expr よりは bash の機能を使ったほうがいい。 以前書いた記事にある。bash/zsh の正規表現を使う方法が個人的には優れていると思う。 takuya-1st.hatenablog.jp どうしても sh じゃないとだめなんだったときは expr を使う選択肢になる。 /bin/sh の場合は expr で正規表現を扱う。 シェルの正規表現は、次のようにかける。 expr "なにか文字列" : "regex" または、次のように書く。 expr match "なにか文字列" "regex" expr は expression の略だったかとおもう。Expressionの名前の通り、文字列表現の式を評価をする。四則演算なども使いま

    シェル ( /bin/sh ) での正規表現マッチ。 - それマグで!
  • 1