タグ

2014年8月29日のブックマーク (6件)

  • 詳説 正規表現 第3版

    「正規表現がこれだけ多種多様な言語やアプリケーションに取り入れられているのは、立派な理由があるからだ。正規表現は非常に強力なのだ。(中略)正規表現を使えば、データを自由に操れるようになる。データをコントロールし、自分のための仕事をさせられるのである。正規表現をマスターすることは、自分のデータを支配することなのだ。」(書「はじめに」より) ―書は正規表現の概念を詳細に解説し、言語やツールの実例を豊富に示しながら、正規表現への理解を深める解説書である。第3版では、前版のJavaと.NETに加え、新たにPHPの章が追加された。正規表現の質を読み解く決定版。特に正規表現を使いこなしていると自負している人にほど読んでほしい。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ち

    詳説 正規表現 第3版
  • 正規表現クックブック

    TOPICS クックブック , Programming , Perl , PHP 発行年月日 2010年04月 PRINT LENGTH 552 ISBN 978-4-87311-450-7 原書 Regular Expressions Cookbook FORMAT PDF 大量のドキュメントからの検索や、エディタによるテキストの編集、検索やテキスト操作を必要とするソフトウェアの開発など――書はコンピュータでテキストを日常的に操作する人のために、正規表現について知るべきあらゆることを網羅しています。最初の3つの章には、役立つツールと基的な知識をまとめてあり、正規表現を使うための基礎的な技能を身に付けられます。その後の各章では、テキスト処理の領域を深く掘り下げながら、さまざまな正規表現のアイデアと実例を合わせて示しています。また、PerlRubyPythonJavaScript

    正規表現クックブック
  • Unicode正規化

    正しい並び替えでは、表示は(A)のままですが、間違った並び替えでは、正規結合クラスが互いに等しいMACRONとACUTEを並び替えたため、表示は(B)のように、eの上のアクセント記号の位置が入れ替わってしまいます。 正規分解・互換分解 ある文字列の正規分解 (Canonical Decomposition) を得るには、まず、それぞれの文字を正規マッピングによって再帰的に、可能な限り、分解します。すなわち、1回分解した後に現れた文字がなおも分解可能であればさらに分解します。分解マッピングがその文字自身である場合は、分解不可能なので、そのままです。 しかし、分解しただけでは必ずしも正しい結果が得られません。つまり、結合文字の順序の一意性を保証するため、分解後の文字列に対して正規順序アルゴリズムを適用しなければなりません。このように、正規マッピングによる再帰的分解と、正規順序アルゴリズムによ

  • Pythonで unicodedata.normalize を使って全角半角を正規化する方法

    (この記事は 2008年03月14日に別のブログに投稿した記事を移動・編集したものです。) インターネット上の日語を扱っていると、全角半角が統一されていない事による表記揺れをなんとかしたい場面に出くわします。半角で書かれた iPod も、全角で書かれたiPodも同じものとして扱いたいときや、あるいは単に見た目がきれいになるように、英数字は半角に、カタカナは全角にそろえたい、という場合です。 Python では setomitsさんによる zenhan.py を使うと、文字種ごとに全角半角を選択して変換することができ、除外文字も設定できるので便利です。ただ、そこまで柔軟でなくても良く、単に表記揺れがなくなれば良い、という場合も多いかと思います。その場合はPythonの標準ライブラリに含まれる unicodedata モジュールの normalize 関数を使うと便利です。 >>> impo

  • Javaで入力チェックに使える正規表現まとめ

    Struts1.3.5のMaskValidatorでまとめてたけど、改めてまとめてみた。よく使いそうなものだけを選抜。正規表現無敵説を感じる。 チェックはEclipseのQuickRExを使っている。Windpowsについている文字コード表をもとに調べた。文字コードはUnicode。 机に一冊 こういうは一札持っておきたいところ。 半角英字 https://gist.github.com/daipresents/119881443e690c492a0d7b5deb6e1e1d.js?file=gistfile1.txt ex => abcdefghijklmnopqrstuvwxyz 半角数字 https://gist.github.com/daipresents/119881443e690c492a0d7b5deb6e1e1d.js?file=gistfile2.txt ex => 0

    Javaで入力チェックに使える正規表現まとめ
  • FileMergeをLaunchpadから実行できるようにした - Umi Uyuraのブログ

    ※2014/09/10追記 ブコメで教えて頂きましたが、こんなマドロッコシイことしなくても、シンボリックリンク張れば瞬殺でした! id:toshimitsu_sasaki さん、ありがとうございます! $ ln -s /Applications/Xcode.app/Contents/Applications/FileMerge.app /Applications/ まあ、なんか使い道あるんじゃないってことで... ※2015/05/26追記 Meldという差分比較ツールも使っていて、こんなツールも作ってみたので、良かったら使ってみてください。 umi-uyura.hatenablog.com FileMergeはXcodeのDeveloper Toolsに含まれている差分比較/マージツールですね。 Windowsの頃はWinMergeに非常にお世話になっていました。 ファイルだけでなくフォ

    FileMergeをLaunchpadから実行できるようにした - Umi Uyuraのブログ
    toshimitsu_sasaki
    toshimitsu_sasaki 2014/08/29
    ln -s /Applications/Xcode.app/Contents/Applications/FileMerge.app /Applications/ で。