タグ

2012年5月27日のブックマーク (2件)

  • 「正規表現」に無限のパワーを与える"田中哲スペシャル" - Atzy->getLog()

    先日、「正規表現」の話を書きました(d:id:atzy:20080905)が、(自称)正規表現専門家の私が、ほとんど使われていないけれど、すさまじいパワーを持つ機能を紹介しましょう。 それが「田中哲スペシャル」です。私はこれを使い始めてから肩こりは治るわ、イボ痔はよくなるわ、女の子にモテモテになるわと、人生が変わりました。 田中哲スペシャルとは このような一風変わった名前がついているのは、田中哲(たなかあきら)さんが最初のアイデアを生み出したためです。 2002年4月3日に「鬼車」と呼ばれる正規表現ライブラリ関連で提案され,そして使えるようになりました。鬼車はRuby 1.9やらPHP5やらで利用することができます。 (ruby-dev:16732) sharing sub-regexp 簡単にいいますと「同じ表現を何度も書くのがウザイ」というものです。例えば「ホスト名(FQDN)にマッチ

    「正規表現」に無限のパワーを与える"田中哲スペシャル" - Atzy->getLog()
    seuzo
    seuzo 2012/05/27
  • AppleScriptで扱う日本語(マルチバイト)文字列について - AppleScript

    ※上記で×になっていても変換は行えます。ただ文字化けが発生する確立が高いということを認識していてください 文字列の比較ではエンコードに関係なく文字の違いを判別してくれます。 set moji to "あいうえお" set uni16 to moji as Unicode text set uni8 to moji as «class utf8» if moji = uni8 and moji = uni16 and uni8 = uni16 then display dialog "OK" else display dialog "NO" end if 上記を実行すると「OK」と表示されます。 ところがファイルに出力する際にはそれぞれの型に応じたエンコードの値で出力されます。スクリプトから出力したファイルが文字化けしている場合、writeの際の文字コードが統一されていないのが主な原因です。