タグ

regexに関するworks014のブックマーク (32)

  • 漢字、ひらがな、カタカナにマッチさせる方法 | 正規表現

    Unicodeプロパティがサポートされない場合 文字クラスで、文字が定義されているコードの範囲を指定します。このときShift_JISなどの[亜-熙]では不十分で、Unicodeブロックの範囲を指定する必要があります。 ひらがな Hiragana (Unicode block) - Wikipedia 表記1 … [\u3041-\u3096] 表記2 … [\x{3041}-\x{3096}] カタカナ Katakana (Unicode block) - Wikipedia 表記1 … [\u30A1-\u30FA] 表記2 … [\x{30A1}-\x{30FA}] 表記1 … [々〇〻\u3400-\u9FFF\uF900-\uFAFF]|[\uD840-\uD87F][\uDC00-\uDFFF] 表記2 … [々〇〻\x{3400}-\x{9FFF}\x{F900}-\x{FA

  • OS間で気をつけるべき正規表現 - DTPab

    【訂正 2018.9.4】 正規表現の書き間違いを訂正しました(赤字部分)。 今回はスクリプトからちょっと離れまして、正規表現のお話です。 僕の勤める会社では、Mac環境とWin環境の両方があり、OSを跨いで作業することもしばしばあります。そんなときに、用意した正規表現スタイルがMacでは適用されるのにWinでは適用されない(もしくはその逆)ということがありました。割と知られているとは思うのですが、注意喚起も含めてご報告です。 段落スタイルを作成し、ひとつめの正規表現スタイルに「U+2212のマイナス記号」と「U+301Cの波ダッシュ」の文字カラーをマゼンタにするもの、ふたつめに「U+FF0Dのマイナス記号」と「U+FF5Eの波ダッシュ」の文字カラーをシアンにするものを登録します。 これを実際に適用すると下図のようになります。 このように見た目はほとんど変わらない文字ですが、正規表現ではし

    OS間で気をつけるべき正規表現 - DTPab
  • 正規表現サンプル集

    検索したい文字列 ※クリックで詳細説明に移動 正規表現 ※赤い字がメタ文字、グレーの「\」はエスケープのための「\」 bから始まってkで終わる3桁の文字列

  • 「正規表現」を使ってデータを加工してみよう 【文学・歴史資料のデジタル加工入門1】(木越 治) | 八木書店グループ

    「正規表現」を使ってデータを加工してみよう 【文学・歴史資料のデジタル加工入門1】(木越 治)【はじめに】 コンピュータと付き合うようになって30年以上が経過した。はじめてコンピュータを買ったのは、忘れもしない昭和60年(1985)の秋。マシンは、NECのベストセラー機PC9801VM2。NECのサイトに載っているデータによると定価415,000円とある。B4用紙も印刷できる大きなプリンタと併せると百万円近くしたと思う。 もちろん私費で買えるわけもなく、勤務先の特別配分研究費が廻ってきたのをこれ幸いに購入したのである。いまも現役で毎年バージョンアップを続けているワープロソフト「一太郎」の最初のバージョンが出たばかりの頃である。一太郎の歴史のサイトを見ると、「恋に落ちて」(小林明子)や「ミ・アモーレ」(中森明菜)がヒットし、「阪神タイガースが初の日一」になった年とある。バブル直前の頃である

    「正規表現」を使ってデータを加工してみよう 【文学・歴史資料のデジタル加工入門1】(木越 治) | 八木書店グループ
  • InDesignの正規表現では、後読みに繰り返しや選択が使えない - 名もないテクノ手

    InDesignの正規表現で、後読み(戻り読み)には繰り返しや選択が使えません。これはInDesignの正規表現の仕様です。たとえば下図のようなキャプションの「●」だけに文字スタイルを適用したいときを考えてみましょう。 最初に思いつくのはこんな正規表現です。 (?<=^図\d?\d)● しかし、マッチしません。「(?<=^図\d+)●」なども同様です。後読みの中では繰り返しは使えません。 正規表現クックブックのP95「後読みのさまざまなレベル」に少し解説がありました。ちょっとだけ引用します。 正規表現ソフトウエアは、テキストを左から右に探すように設計されてきました。多くの場合、後読みはちょっとしたハックとして実装されています。後読みに書き込まれた文字数を計算し、その字数分だけ後戻りし、後読み内のテキストと対象テキストを左から右に比較するのです。 要するに、基的には後読み内のテキストは固定

    InDesignの正規表現では、後読みに繰り返しや選択が使えない - 名もないテクノ手
  • イメージで感じて覚える正規表現 その1 - Perl

    正規表現についてよく質問されるもので次のようなものがあります。 「文字クラスの中のメタ文字ってエスケープ必要なんですか?」 答は不要。でもそれだけじゃあつまらないですね。では今回はもうちょっと踏み込んで文字クラスのイメージを考えてみましょう。 前回は、正規表現を表す最小パターンは一文字を表現する文字クラスということをご説明させていただきました。さらに一歩踏み込んで理解を深めてみましょう。よく、 「メタ文字であるピリオドをマッチさせるためにはバックスラッシュでエスケープしましょう」 という説明があります。では「[ ]」の中で使うピリオドはどうでしょうか? 「[ ]」の中でピリオドを指定する場合、バックスラッシュによるエスケープは必要ありません。なぜなら「[ ]」は文字クラスであり、それ全体で1文字を表すものです。その内側に「全ての文字を表す文字クラス」があっては、 「[ ]」の存在意義が根底

  • イメージで感じて覚える正規表現 「はじめに」 - 日々の出来事

    はじめに 「正規表現をある程度勉強し、それなりに使ってはいるけどいまいちわからない」 という気持ちをお持ちの方は結構いると思います。持論ではありますが、それらの方に共通しているのは知識は十分あるのですが正規表現に対するイメージが足りていないように感じます。 正規表現に対するイメージというのは、 「正規表現の最小単位は文字クラスであり、正規表現とはその文字クラスの集合(パターン)である」 ということです。文字クラスとはそのものずばり1文字を表す表現のことです。 よく正規表現の解説でまずは「メタ文字から覚えましょう」というものがあります。たしかにメタ文字を理解することは正規表現をいち早く理解する方法ではありますが、文字クラスとパターンの関係をイメージするステップとしてはあまりふさわしくありません。 そのようなわけでここからは「正規表現はある程度勉強したけどいまいちわからなかった」という方を対象

  • 正規表現スタイルで全半角の区別

    [5617]正規表現スタイルで全半角の区別 | 投稿者:グンマ | 投稿日:2011/02/26(Sat) 13:12:35 教えてください。 正規表現スタイル内では数字の全角・半角の区別はできないのでしょうか? [0-9] [0-9] どちらも数字全部が対象になってしまいます。

    正規表現スタイルで全半角の区別
    works014
    works014 2015/01/15
    …罠にひっかかったではないか…
  • 【第638回】正規表現の先読み、後読みのアサーション : イジハピ!

    2014年07月09日19:45 【第638回】正規表現の先読み、後読みのアサーション カテゴリすぐわかる気がするPerl query1000 Comment(0)Trackback(0) 正規表現による検索置換を使っていて突き当たる問題として、ある条件の時のみ検索置換を行いたい、ということがある。 たとえばIT用語で、カタカナ列の末尾にある音引き(ー)を取りたいとする。 (ちなみにぼくは、以前書いたが、IT用語の末尾の音引き削除は意味のない習慣で、やめるべきだと思っている。最近はマイクロソフトをはじめ音引きを付ける企業も多い) (置換前)コンピューターが使えて便利だ (置換後)コンピュータが使えて便利だ 単純に「ー」を全削除すると (置換後)コンピュタが使えて便利だ となってしまう。 そこで、カタカナ以外の前にある音引きを削除する、と考える。 しかし、カタカナ以外の1文字は[^ァ-ン]だ

    【第638回】正規表現の先読み、後読みのアサーション : イジハピ!
  • Riue ちゃんの正規表現講座

    sixnine.net 2024 著作権. 不許複製 プライバシーポリシー

  • 【第573回】UnicodeプロパティとPerl正規表現(その1:文字クラスとひらがなの範囲) : イジハピ!

    2014年04月09日15:48 【第573回】UnicodeプロパティとPerl正規表現(その1:文字クラスとひらがなの範囲) カテゴリすぐわかる気がするPerl文字コード【プチ】研究 query1000 Comment(0)Trackback(0) 今日はUnicode時代の(use utf8を使った)Perlの正規表現について考えてみたい。 あいかわらずヌルいことしか書かないからな。 詳説 正規表現 第3版posted with カエレバJeffrey E.F. Friedl オライリージャパン 2008-04-26 正規表現で、文字クラスというのがある。 [0-9]だと0,1,2,3,4,5,6,7,8,9というASCIIの数字のいずれか1文字にマッチする。 これは[0123456789]と等価である。 [a-zA-Z]だとASCII英数字1文字にマッチする。 これは[abcdef

  • 正規表現の解説 中級編

    例を上げながら、 正規表現の書き方を解説していきます。 以降、 検索に正規表現を使うことを前提に説明をします。 [共通設定]−[一般設定]で[検索文字の色分けをする] にチェックを入れておいた方が分かりやすいかもしれません。 検索対象ファイルは K2Editor の ReleaseNote.txt(Readme.txt ではありません)です。 (あら捜しに近いこともやっていますが、 ご了承ください(笑)) とりあえず、 「.*」で検索してください。 改行以外のすべての文字がマッチすると思います。 (空白だけの行は色がつきませんが、 下移動等で動かしていくと、 マッチしていることが確認できます) それでは、 何故全ての文字がマッチしたのかを解析してみます。 検索語は 「.*」です。 初級編での解説をみると、 「.」は 改行を除く任意の1文字 「*」は 直前のパターンの0回以上の繰り返しとなっ

  • 正規表現の先読み・後読みを極める! - あらびき日記

    この記事は abicky.net の 正規表現の先読み・後読みを極める! に移行しました

    正規表現の先読み・後読みを極める! - あらびき日記
  • 青空文庫ルビを正規表現でInDesignルビに変換する: InDesign使いこなしの鉄則

    DTP-S(誰でもできるDTPのために)主宰の上高地 がInDesignを使ううえで知っておきたいTipsやノウハウお届けします。 レイアウトはInDesign側で行うので、InDesignタグで青空文庫の記号で注意書きしてある部分をエディタで変換する。変換は正規表現を使う。というか、正規表現を使わないと変換は出来ない。 正規表現という呼び名は途轍もなく威丈高に感じて敬遠してしまう。多分「正」という文字が距離感を生み出しているのだろう。もともと「regular expression」といい、その訳語として「正規表現」という言葉が使われている。的を得た訳語とはいいがたい。「regular expression」は平たく訳すと「定期的な表現」という意味なので、その方が実際の使い方に即している。ただ「定期表現」とすると、在り来たりの言葉になり有り難みは著しく薄れてしまう。 正規表現とは何かという

  • [連載:正規表現] Unicode文字プロパティについて(1)|TechRacho by BPS株式会社

    はじめまして、hachi8833です。 正規表現において、使わないまま死ぬのはあまりにもったいない「Unicode文字プロパティ」について解説します。これについてネット上にまとまった情報がほとんどなく、しかたがないので自分で書くことにしました。書きながら早くも記事があふれてきたので、見出しに「連載」の文字を追加などしてみました。たぶん他所ではほとんど見かけることのない連載になると思います。よろしくお願いします。 通常の開発においては、目的を達成する正規表現を作成してコードが動けば事足りるものであり、コーディング中に正規表現と延々付き合うことは普通ないでしょう。料理人は包丁を研ぐのに時間をかけすぎないものです。しかし特殊な業界の特殊な人々(日に5人もいないと思います)は、来る日も来る日も正規表現を書き続けていたりするので、このUnicode文字プロパティは当にありがたいものです。私の場合

    [連載:正規表現] Unicode文字プロパティについて(1)|TechRacho by BPS株式会社
  • 正規表現をわかりやすく視覚化してくれる『REGEXPER』 | 100SHIKI

    おっと、これは便利かも。 REGEXPERを使えば、JavaScriptの正規表現をわかりやすく表現してくれる。 一見、難解な正規表現だが、これを通しても見ると「なるほど、この文字とこの文字にはされまれていて、この間は何の文字でも良いのだな」といったことがわかるようになる。 他の人のコードを読んでいて「?」となったときに試してみてもいいかもですな。

    正規表現をわかりやすく視覚化してくれる『REGEXPER』 | 100SHIKI
  • InD-Board

    こんにちは はじめまして 困り果ててこちらに辿り着きました ご存知でしたら教えてください InDesignCC2024を使用しています IntelチップのiMac・M3チップのMacBook Proで試しましたが同様でした レイアウトを組んだ後、プレゼンテーションモードで確認をしたいのです 通常画面でショートカットキー⌘⌥2を押せば プレゼンテーションモードにはなるものの 元の画面に戻ることができません ショートカットキー⌘⌥2を押しても、ESCを押しても戻りません しかもメニューバーも出てこなくなり 毎度毎度、強制終了をしている、という状況です ネット上で検索しても このような症状で困っている方がおらず 私自身で何か変な設定をしてしまっているのかもしれませんが 自分で解決策を見つけられません 何かよい方法がございましたら教えてください No.10534 2024/02/05(Mon) 1

  • 「文字の学校」インデザインの正規表現: しること一緒

    講師は市川せうぞーさん。スクリプトとか、色々お世話になることが多い方です。 自分用メモなので、間違っているかもしれません。が、ほぼ、せうぞーさんのePUB(『InDesign者のための正規表現入門』)とか、WEBサイトに載っている話が多いので、気になる方はそちらをチェックしてください。 せうぞーさん:最初は皆さんの課題を。(お、実地訓練からですか。) 事例1:書籍の文中にソースコード文が出てくるような体裁のもので、ソースコード文の部分だけ上手く正規表現でマッチできませんか。 せうぞーさん:正規表現では上手く出来ません。コード文なので、途中に改行が入って「{」なんてのが入ってきたりすると最短マッチになって全部読まない。ランダムなテキストではコード文だけを検索することは出来ないけれど、入稿されてくるテキストデータは大体何かマーキングされて(例えば、ソースコードの前後に★マークをつけるとか)

    works014
    works014 2012/06/19
    _「文字の学校」インデザインの正規表現
  • 市川せうぞーに学ぶ「InDesignで正規表現」6月3日開催!

    こちらの講座は終了いたしました。 開催概要 開講日時 6月3日(日)14:00~16:00(2時間/途中休憩含む) 講 師 市川せうぞー 定 員 60名(先着順・要申し込み) 会 場 ちよだプラットフォームスクウェア5F 505会議室 (東京都千代田区神田錦町3‐21 東京メトロ竹橋駅より徒歩2分/JR神田駅より徒歩12分/東京メトロ神保町駅より徒歩7分) アクセス 受講料 3000円(当日会場にて支払い) 講座の内容 InDesign CS3で正規表現が実装されてから、既に5年が経っています。実際にInDesignの正規表現を実務でバリバリお使いの方も多いかもしれません。そうした中で「なぜか思い通りにマッチしない時がある」「誤置換で冷や汗をかいた」「いまひとつ自信がない」などという声が聞かれることもしばしばです。 正規表現はメタ文字の種類や定型の解法を暗記することではありません。正規表現

  • 正規表現について(復習編) - 手抜きLab@DTPの現場