タグ

InDesignと正規表現に関するFeZnのブックマーク (9)

  • EPUB版『InDesign者のための正規表現入門』頒布はじめました。 - 名もないテクノ手

    InDesignを使って正規表現の基礎と実例が学べるテキストです。EPUBフォーマット*1になっていますので、多くのEPUBリーダー上で閲覧できます。 目次 目次は以下のとおりになっています。 InDesign者のための正規表現入門 はじめに 基礎編 正規表現とは何か? 正規表現で何ができる? ■初めての正規表現検索 メタ文字とは? メタ文字を攻略する ■文字を表すメタ文字 ■位置を表すメタ文字 ■繰り返しを表すメタ文字 ■その他のメタ文字 ■メタ文字をそのものを表すには 「先読み」と「戻り読み」テクニック ■先読み ■戻り読み ■補足 陥りやすい罠 ■欲張りなマッチ ■否定文字クラス ■方言 正規表現の考え方 正規表現スタイルについて InDesign独自の正規表現 ■独自のメタ文字表現 ■改行文字 ■全角半角の区別 ■POSIXブラケット表現 実技編 マーキング済みのテキストに段落スタ

    EPUB版『InDesign者のための正規表現入門』頒布はじめました。 - 名もないテクノ手
  • 「正規表現の世界」のスライドを公開 - 名もないテクノ手

    InDesign CS4からFlashへ書き出せるってことなんですけれど、わたし的にはプラットフォーム違うって気分は抜けきらなくて、遊びっぽくサンプル書き出ししてみました。 せっかくなので、今年あちこちでやった「正規表現の世界」のスライドを公開したいと思います。*1 副読「regex world in InDesign CS3」(PDF)も併せて参考にしてみてください。

  • 正規表現スタイル Tips(2) - 名もないテクノ手

    4桁の数字を4分数字、3桁の数字を3分数字、2桁の数字を2分数字にする 下図のような縦組で、数字を入力するだけでそれぞれの桁に応じた数字字形にします。 正規表現は以下の通り 文字スタイル正規表現 四分字形(?<!\d)\d{4}(?!\d) 三分字形(?<!\d)\d{3}(?!\d) 二分字形(?<!\d)\d{2}(?!\d) 適用結果はこうなりました。 num_glyphはもう役目を終えたかもしれないなあ。。。 図や表番号だけを太字&泣き別れ禁止にする 文中にある「図1」や「表2-3」などの文字列を自動的に太字にし、かつ泣き別れ禁止にします。下図のように文字列が泣き別れていると、なんだか気になって仕方ない人向け^^ 使用する正規表現は [図表]\d\d?[\.-]?\d* 適用すると... 英数字の言語を「米国」にする 普段、なにげなく「日語」属性で混植しているけれど、InDesi

    正規表現スタイル Tips(2) - 名もないテクノ手
  • 正規表現の変更点(1) - 名もないテクノ手

    たまたま気がついてしまったんですけれど...正規表現が修正されています。内部的にL10N(localization)実装になったのだと推測します。どんなことが起こるかというと... \wは仮名や漢字などを含む 古い処理系で育った人は\wはwordを構成する文字、すなわち[a-zA-Z0-9_]だと学校で習ったはずです。しかしL10Nで日語に対応することで、漢字やひらがな、約物にマッチします。正規表現「\w+」で検索すると、下図のように「市川せうぞー24歳」すべてがマッチします。 ruby1.8系で #! /usr/bin/ruby p "市川せうぞー24歳".slice(/\w+/) #=>24 と「24」が返りますが、明示的にUnicodeを指定して実行すると... #! /usr/bin/ruby -Ku p "市川せうぞー24歳".slice(/\w+/) #=>"市川せうぞー24

    正規表現の変更点(1) - 名もないテクノ手
  • 正規表現スタイル Tips(1) - 名もないテクノ手

    こりゃ便利! と思えるような正規表現スタイルを使ったTipsを紹介するシリーズ(?) ダーシを入力すると必ず2倍ダーシになる。 ダーシを2つ繋げて2倍ダーシにすると、ジャスティファイの具合で文字間が離れてしまうことがあります。行頭行末で泣き別れてしまうこともあります。かつ、ダーシが長くて文字にくっついたりするのも美しくありません。ひとつのダーシの水平比率を180%くらいに設定し、文字の前後のアキを八分くらい開いていると自然な感じになります。しかし、これをひとつひとつやっていたら気分がわるかろうて。こんなテキストがあったとします。 段落スタイルの「正規表現スタイル」を設定します。 はい。ダーシを入力するたびに、文字スタイル「2倍」が適用されて、読みやすい2倍ダーシになりました。 段落の最後のラインに1文字だけ残るのを禁止したい。 ちょうど上の図が、そんなことになっています。ひとりぼっちは淋し

    正規表現スタイル Tips(1) - 名もないテクノ手
  • InDesign居残り補習室 【正規表現】CS3の正規表現のバグ

    日は正規表現ネタをもうひとつ。 名もないテクノ手:思いも寄らない落とし穴。を拝読しました。 実は上記リンク先の記事を読み終えて、はてなスターのボタンを押してすぐに、記事の件でブログ主のせうぞーさんからTELがあったので驚きました(^^; しかも私がひとつめのスターボタン押したのばれてるし(^^;; 追試しました。検索と置換:GREPにて(このGREPという用語には不満がありますが) 検索パターン:[ァ-ヾ]+ 「カナを区別」「全角半角を区別」のオンオフに関係なく、ひらがなにもヒットします。 ひとまず、正規表現なのになぜ「カナを区別」ボタンが実装されているのか、という疑問は脇に置いておきます。 ちなみに「全角半角を区別」をオフで、ゴルァ(半角)にもヒット(それは不思議ではない) 検索パターン:[ア-ン]+ 「カナを区別」がオンになっているとカタカナにはヒットせずにひらがなにヒットします。

  • InDesign居残り補習室 【正規表現】最短一致

    DTPオペのInDesignおぼえがき:正規表現-何かの文字ではじまり、何かで終わるを拝読しました。 正規表現は“最左最長一致検索”が基です。 でも、拡張正規表現(いまどきそんな言い方するのかな?)の中には最短一致させるための表現方法が用意されています。 下の例文の中で、「君が好きではない。」と「君が好きだ。」の2箇所にマッチさせる正規表現の一例を挙げてみます。 俺は君が好きではない。おおお。だが彼は君が好きだ。 下の3つの正規表現のうち、一番上の表現だとマッチする文字列が最も広範囲になり、思惑に反して例文のうち行頭の「俺は」以外の文字列にマッチしてしまいます。 それ以外のふたつは同じで、上の例文においては思惑通り2箇所にマッチします。 君が好き.*。 君が好き[^。]*。 君が好き.*?。 一番下の表現は、少々古い処理系だと使えないのかな? sedとかだとダメっぽいですよね。 perl

  • 漢字の表現 - 名もないテクノ手

    まず、InDesign CS3のマニュアルで、「検索のメタ文字」 http://help.adobe.com/ja_JP/InDesign/5.0/help.html?content=WSa285fff53dea4f8617383751001ea8cb3f-6f59.html の漢字を表す正規表現が「\K」になっていますが、「~K」の間違いです。 この ~K がちょっとしたクセ者で、おおむねUnicodeのCJK統合漢字領域にヒットするようですが、たまに拡張領域の漢字にもヒットするようです。「網がより大きければいいか」って考えもありますが、そこから漏れる魚もいて「完全じゃない」ことに神経質になる人もいるかと。 SJISまんせー、だった幸福な時代は終わって、[亜-煕]なんて表現も過去の遺産です。Unicodeなら[一-龠]と書いてください(「一:U+4E00」「龠:U+9FA0」)。漢字は私

  • InDesign CS3の目玉機能は「検索と置換」における正規表現対応ではないだろうか

    InDesign CS3の目玉機能は「検索と置換」における正規表現対応ではないだろうか スポンサードリンク Tweet 文字ものをやる時の大半の労力は文字の正規化にあると思うんで、DTP 業界における文字の正規化のツールとしての正規表現の使用はすごい広がっているかと思えば、結構正規表現知らない人が多かったりします。 このまえ、800ページに配置されたテキストの不特定部分に入っている、HTML の sub 要素(下付き)を、InDesign 側の下付き属性に置換するっていうのをやってもらうことになったんですけれども、できないって言われて、それはつまり、InDesign の検索と置換機能が貧弱で、きょう日、正規表現すら持っていない。さすれば、オンラインソフトで正規表現による置換ダイアログ作ってくれた方がいらっしゃるよーてお教え差し上げても、オンラインソフトの使用には二の足を踏む状況であるよう。

    FeZn
    FeZn 2007/06/25
     あうあー。これは移行したくなってきた。
  • 1