タグ

2006年8月22日のブックマーク (2件)

  • SimplyTerms - 正規表現

    正 規 表 現 正規表現とは、文字列のパターンを指定する方法です。翻訳者や編集者のように、文字の並びを加工する人にとって、強力でとても便利なツールになります。 「整形・置換」タブで表示される機能は、みな、正規表現で実現されています。そのほとんどは、1行からせいぜい10行程度。これだけで、さまざまな機能を実現することができるのです。 正規表現は、SimplyTermsだけでなく、秀丸などのエディタ、Word・一太郎などのワープロソフトでも使えます。それぞれに微妙な違いがありますが、一つ、覚えれば、他もかなり使えるようになります。 簡単に使えるように、ヘルプにガイドをつけるとともに、SimplyTermsに正規表現ファイル作成ツールを組み込んであります。これを機会に、ぜひ、覚えてください。 正規表現ファイルの注意点 SimplyTerms用に正規表現ファイルを作る場合、以下の点に注意してくださ

    PoohKid
    PoohKid 2006/08/22
    「よく使うパターン」が便利
  • MODULE.JP - 日本語に絡むUnicodeブロックとスクリプト(正規表現)

    といった感じ。ちなみにjava.util.regexとPerlのUnicodeブロックは接頭子Inを使うが、.NETの場合は接頭子Isを使う、という差異があります。 Unicodeスクリプトとブロックの違いがビミョーに見えるけど、ブロックがコードブロックをゴリッと指定したものに対して、スクリプトは特定言語に関係する文字の種類を直接指定するものなのでブロックよりも断定的、って感じで見れば良かなと。ちなみにUnicode関連のドキュメントによるとUnicodeプロパティとスクリプトで日語の文章を表そうとすると m/(?:(?:\p{Hiragana}|\p{Katakana}|\p{Han}|\p{Latin}|\p{Common}) (?:\p{Inherited}|\p{Me}|\p{Mn})?)+/x; こんな感じになるそうな。実際流通している文章はこれより多様なので現実とは微妙に乖離

    PoohKid
    PoohKid 2006/08/22
    Unicodeブロック