タグ

正規表現に関するzichaoのブックマーク (143)

  • 正規表現のお勉強 - 自転車操業日記

    半角かっこ内に4桁の数字があるのを全角かっこ内に4桁の半角数字に統一する。 和欧混植のデータなので,半角かっこを一括で全角に置き換えることはできなくて,4けたの数字を包んでいるやつだけ置き換えたい。 一発でできそうな気がするけど,思いつかないから暫定版。 ひらくほうだけ先に置き換える。 検索文字列 \(+(?=\d+4)  【\((半角かっこを探せ;\はキャラクタを示す記号) +(以下条件) (  )(条件の範囲) ?=(目的の文字の後に以下が続く) \d(半角数字) +4(繰り返し4回)】 置換文字列 ( つぎにとじるほう。なぜか繰り返しが使えない。どうして? りくつもいまいちわからない。とりあえず以下のようでうまくいった。前~読むか後から読むかの違いなのかなあ。勉強勉強。 検索文字列 (?<=\d\d\d\d)\) 置換文字列 ) たぶん,この二つをくっつけるやり方が見つかれば,一発で

    正規表現のお勉強 - 自転車操業日記
    zichao
    zichao 2012/09/05
    半角かっこ内に4桁の数字があるのを全角かっこ内に4桁の半角数字に統一する。和欧混植のデータなので,半角かっこを一括で全角に置き換えることなく4けたの数字を包んでいるやつだけ置き換える。
  • JavaScript正規表現での最短マッチと、改行が含まれた文字列のマッチ - ゆず日記

    今更かもですがメモ。 最短マッチ var hoge = "<div class='wrap'><div class='target'>(・ω・ ミ 3 )∋</div></div>"; hoge.match(/<div class='target'>.*<\/div>/); // 実行結果: ["<div class='target'>(・ω・ ミ 3 )∋</div></div>"] hoge.match(/<div class='target'>.*?<\/div>/); // 実行結果: ["<div class='target'>(・ω・ ミ 3 )∋</div>"] 改行を含めた文字列のマッチ var hoge = "<div class='wrap'>\n<div class='target'>\n(・ω・ ミ 3 )∋\n</div>\n</div>"; hoge.match

    JavaScript正規表現での最短マッチと、改行が含まれた文字列のマッチ - ゆず日記
  • 正規表現サンプル集

    検索したい文字列 ※クリックで詳細説明に移動 正規表現 ※赤い字がメタ文字、グレーの「\」はエスケープのための「\」 bから始まってkで終わる3桁の文字列

  • CS4/5:学名とオーサー名の処理 - 自転車操業日記

    生物の学名の索引をつくるときで,オーサー名を表記する必要があることがある。 学名そのもの(ラテン語の部分)とオーサー名の部分が区別できるように,文字種を変えなければならない(学名はイタリック,オーサー名はローマンを使うことが多い)。 一つ一つ手でやっているとやっかいなので,なんとか自動化できないかな,と考えていたのだけど,正規表現スタイルをつかう方法で実現できるようだ。 数としてはラテン名の部分のほうが多いので,これをベースに索引用の段落スタイルをつくる。あと,オーサー部分に当てるローマンの文字スタイルもつくる。 オーサー名は学名の文字列の途中や最後にある。そして,大文字から始まる(人名だし)。だから,直前に英文スペースがある大文字から始まる文字列を検索して,その部分にオーサー名用の文字スタイルを当ててやればよい。これを,索引の段落スタイルに埋め込んでおけば,書き出しはほぼ自動化できる。

    CS4/5:学名とオーサー名の処理 - 自転車操業日記
  • ブラウザで正規表現のお勉強ができる『Scriptular』 | 100SHIKI

    よくあるツールではあるが、最近正規表現を勉強しなおしたのでご紹介。 Scriptularでは、インタラクティブに正規表現を試すことができるようだ。 エンジンとして使っているのはJavaScriptのようだ。クライアントサイドだけで試せるのでさくさく動いていい感じだ。 また右横にはリファレンス的に説明もあるのでいちいちどこかを検索する必要もない。 そろそろ正規表現を・・・という方は試してみてはいかがすかね。

    ブラウザで正規表現のお勉強ができる『Scriptular』 | 100SHIKI
  • 文字の学校 講座一覧

    開催中・近日開催の講座/イベント(開講日順) ブックデザイン勉強会【第3期】 日時:2020年1月19日(日)、2月16日(日)、3月15日(日) 全3回 会場:UNPLAN新宿 B1F会議室ほか 講師:川畑博昭さん、板谷成雄さん 終了した講座(開講日順) 公開講座『電子書籍とウェブの表現力』 日時:2011年5月21日(土)18:00〜20:00 会場:ちよだプラットフォームスクウェア5F 505会議室 講師:石井宏治さん シンポジウム『電子書籍の組版を考える』 日時:2011年8月6日(土)14:30〜17:00 会場:ちよだプラットフォームスクウェア5F 会議室 講座『InDesinで正規表現』 日時:2012年6月3日(日)14:00〜16:00 会場:ちよだプラットフォームスクウェア5F 505会議室 講師:市川せうぞーさん 講座『編集者・組版者のための 1+1,CO₂ から始め

    zichao
    zichao 2012/03/09
    仕事が決まれば参加できるかも / 講座『はじめての正規表現』日時:2012年4月21日(土)13:30〜16:30
  • 富豪的正規表現で常用漢字とか色分け表示すれば… - 遠近法ノート

    テキストエディタに、色分け表示ってありますよね。プログラムやHTMLのソースを表示するのに使われてるやつ。あれって普通の文章書きにも使えるんじゃないかと思うんですよね。たとえば「」(カギ括弧)の中を色文字にするとか簡単にできるわけで。 それはさておき、タイトルどおりなのですけど、常用漢字を色分け表示する設定を作ってみました。 この画像は、文字コード表の第一水準の最初のあたりを色分け表示させたものです。見てのとおり常用漢字はバラバラに散らばって入っているわけで、正規表現でよくある [0-9]みたいな範囲指定はまったく不可能。だったら[ ]の中に常用漢字をそのまま全部入れてしまえばいいのではないか、という富豪的アプローチです。 JeditXの設定ファイルをこちらからダウンロード出来るようにしておきますので、まあ試してみてもらえればよいかなと。 常用漢字2010改定Coloring.plist

    富豪的正規表現で常用漢字とか色分け表示すれば… - 遠近法ノート
  • [Perl][正規表現]小話:$君の動きを再確認してみた話 - Perl

    Oh! lady! A-1 dollar B-2 dollars 淫ら~♪ No, on onn..... ~10$ by SMAP~ はい、スタートのネタ歌詞を検索する為に「smap」検索しようとして無意識に「cmap」を検索していたひらくんです。そう今日はダラーダラー、正規表現で文末を表す位置指定子 $ 君の動きを再確認したお話。 先日こんなソースを拝見しました。 $line = "ABCDEFG\n"; $line =~ s/\n$//; print $line . "TEST\n"; $line = "ABCDEFG\n"; $line =~ s/(\n|.)$//; print $line . "TEST\n"; こいつの実行結果はこうなります。 ABCDEFGTEST ABCDEF TEST 最初の正規表現「$line =~ s/\n$//;」は行末の改行文字を削除する処理です

    zichao
    zichao 2012/02/03
    perlは忘却の彼方
  • InD-Board

    環境:Windows11/Indesign CC2023 18.3 最近気が付いたのですが、段落スタイルを別のファイルから読み込むと、読み込まれた段落スタイルに身に覚えのない設定が追加されていることに気が付きました。 読み込むほう、読み込まれる方双方ともに設定していない項目が追加されているのです。 具体的には、なぜか囲み罫と背景色の角丸の半径設定が追加されています。 しかしこの設定を消そうとスタイル設定の編集項目を見るとチェックされていないのです。 このため、読み込み時に勝手に追加された設定を消すことができず困っております。 この現象は何でしょうか。解決法はあるのでしょうか。 ご存じの方がいらっしゃいましたら是非知恵をお借りしたく、ご助言のほどお願いいたします。 No.10597 2024/07/08(Mon) 10:29:38 Mozilla/5.0 (Windows NT 10.0;

  • JavaScriptにて表内やセル内の段落スタイル適用/正規表現置換をしたい

    [4090]JavaScriptにて表内やセル内の段落スタイル適用/正規表現置換をしたい | 投稿者:五月 貴 | 投稿日:2010/01/27(Wed) 21:29:39 MacOS10.5.8 InDesignCS3 5.0.4を使用しています。 表題の件ですが,JavaScriptにて流し込んだWordデータの 正規表現による置換を行おうとプログラムを組んでいます。 テキストのみを選んだ場合(テキストフレーム選択ではなく,流したテキストをドラッグして選んでいます)は正規表現と段落スタイルの適用がうまくいったのですが,うまくできない場所があり,その箇所を選択したところ属性が「Table」や「Cell」になっていました。 試しにCell内のデータにも同じ処理を施してみたのですが, 段落スタイルを適用させようとすると 「applyParagraphStyleが関数ではありません」 というエ

    JavaScriptにて表内やセル内の段落スタイル適用/正規表現置換をしたい
  • 正規表現置換でフォントや異体字属性が抜け落ちました

    [4301]正規表現置換でフォントや異体字属性が抜け落ちました | 投稿者:五月 貴 | 投稿日:2010/02/27(Sat) 13:02:20 先日教えて頂いたJavaScriptによる正規表現置換の後日談です。 他所で試したところ,「フォントが全て替わる」「異体字情報が抜け落ちて別の文字になる」という報告を受けました。 もしかしたら一括置換をする場合は,1文字ごとにフォント情報や異体字情報などを記憶した後で置換し,再度割り当てる作業が必要なのでしょうか? ソースが思い浮かばずまた難儀してしまっており,再度皆様のお力をお借りできればと思っております。 どうぞよろしくお願い申し上げます。

    正規表現置換でフォントや異体字属性が抜け落ちました
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • あかつき@おばなのDTP稼業録 【InDesign CS5.x】正規表現スタイルの小ネタ(複数スタイル適用)

    InDesign CS5.xで作業していて気がついたのですが、 正規表現スタイルを使用すると 「特定の文字列に複数の文字スタイルを適用できる」んですね。 上記キャプチャ例では、 ・「02_Paragraph_normal」でフォントのウェイトのみを変更、 ・「00_TextColor_0-Black」で文字カラーのみを変更 させています。これにより、 ・タブ(\t)に対してはフォントのウェイトと文字カラーを変更し、 ・英数字以外(と読点)には文字色の変更のみを適用 させています。 もちろん適用する文字スタイルに重複する設定(明朝とゴシックのフォント指定など)があった場合は、どちらかしか適用されませんが、使い方によっては非常に重宝しそう、というか重宝しています。

  • 正規表現の文字クラスまとめ - 名もないテクノ手

    先日、Yuji@勉強部屋さんと電話で話していて、文字クラスの理解が正規表現の「一里塚」だなぁ、と感じました。InDesignで初めて正規表現に接する方も多く、戸惑われている人もいらっしゃると思います。 文字クラスは正規表現の中でもちょっと特別な存在です。文字クラス内だけで使えるメタ文字や、位置によって意味が変わるメタ文字もあります。文字クラスについては、日頃使い慣れた人でも間違えやすい部分もあり、結構奥が深いのでおさらいの意味も込めてまとめておきます。 文字クラスの基 ここで言う「文字クラス」は、「POSIXブラケット表現」とも呼ばれます。違うサイトや書籍などで、これらの用語が混在することがありますが、ほぼ同じと考えて差し支えありません*1。 文字クラスは任意の1文字にマッチする「文字集合」を表現できます。 簡単な例から見てみましょう。たとえば「お母さん」と「お父さん」のどちらにもマッチ

    正規表現の文字クラスまとめ - 名もないテクノ手
  • Regex Tester – RegexPal

    RegexPal is a tool to learn, build, & test Regular Expressions (RegEx / RegExp). Results update in real-time as you type. Roll over a match or expression for details. Save & share expressions with others. Explore the Library for help & examples. Undo & Redo with {{getCtrlKey()}}-Z / Y. Search for & rate Community patterns.

    zichao
    zichao 2012/01/17
    区切り箇所が一目瞭然
  • ものかの » 正規表現の略記法 \d と \s と \w

    正規表現の文字クラスの略記法 \d と \s と \w がいつのまにかアレレなことになっていたのでメモ。(1 Perl 5.8 以降で正規表現を使うには use utf8 が必須。 use utf8 では \d と \s と \w の文字クラスの内容が Unicode のカテゴリーに基づいている。 InDesign(Boost)も同様。 PCRE や Ruby は変わりなし。 (2 参考資料:perldoc の perlrecharclass 参考資料:Programming Perl の 5.4. Character Classes ちょっと詳しく見ていきます。 *以降、Perl = use utf8 の Perl ほとんど全ての人が [0-9] の10文字として使っていますが、Perl では \p{Nd} です。ただし、Perlのバージョンによって(対応しているUnicodeバージョン

    ものかの » 正規表現の略記法 \d と \s と \w
  • 行頭以外にある文字列にマッチする正規表現【PHP】 - Programming Magic

    「hoge○○hoge○○○○hoge○○hoge○」という文字列があり、PHP+正規表現で行頭以外にあるhogeを全てHOGEに置換して、「hoge○○HOGE○○○○HOGE○○HOGE○」としたかったのだが、やり方がよくわからなかった。 行頭にある「hoge」マッチする正規表現であれば以下のように簡単に書けるが、行頭以外にあるhogeにマッチする正規表現がわからなかったのでいろいろと試してみた。 preg_replace('/^hoge/', 'HOGE', $text); まず浮かんだのは、戻り読み言明を否定する方法だったが、どうも戻り読み言明のなかで行頭を意味する「^」は使えないらしい。 preg_replace('/(?<!^)hoge/', 'HOGE', $text);

    zichao
    zichao 2012/01/16
    行頭以外にある文字列にマッチする正規表現
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • InDesignでの縦書きでの漢数字の「一」の扱い|DTP Transit

    やっぱり全角ドリして次のようにした方が「一」として認識でき、読みやすいですよね([カーニング]の設定を「和文等幅」にしていれば、全角ドリされますが..)。 ハンドカーニングするほか、「一」のみを選択して、[文字]パネルで[文字前のアキ量」、[文字後のアキ量]を「四分」に設定してもよいのですが、これを手作業で行うのは面倒でやり残しが生じやすく、ナンセンスです。 そこで活用したいのが、正規表現スタイルです。 まずは、文字スタイル(ここでは「前後四分アキ」)を作成します。 文のスタイルの編集画面を表示し、[正規表現]カテゴリに切り替えます。[スタイルを適用]にさきほどの文字スタイルを選択し、[テキスト]に漢数字の「一」を入力します。 新しく正規表現スタイルを追加すると、「\d+」のような文字列が入っていますが、これを無視して適用したい文字を入れることができます。 この方法なら、個別に設定しなく

    InDesignでの縦書きでの漢数字の「一」の扱い|DTP Transit
    zichao
    zichao 2012/01/07
    カーニングを「和文等幅」に設定した文字スタイルを用意して、同じように正規表現スタイル……という手順の方がベターかと思います(フレームグリッドなら「1字取り」でも大丈夫)
  • 『索引のノンブル修正』

    ノンブル修正が大変なのは目次よりも索引です。書籍によって項目の数はバラバラですが、数字は飛ぶし、数は多いし字は小さいし、これが500ページ立ての50ページ以降に2を足すとなると、考えただけでも恐ろしい……。 こんなのが20ページくらいあったら……。 で、方法を考えてみました。せうぞーさんに教えてもらったスクリプトも使えそうですが、まだ未検証ですのでせうぞーさんの正規表現連続置換スクリプト「regex_continuous_substitution.jsx」でいきましょう。 単純にページが送られただけならば、連続置換をうまくつかえば手動よりも早く正確にできるはずです。 連続置換は確認しながらの作業はできません(だからこそ自動化なのですが)。これは命令を間違えるとどこがどう置換されたかわからないため、後からの確認は困難です。 まずは連続置換のポイントを押さえて確実に置換しましょう。 ●確実に拾

    『索引のノンブル修正』