タグ

ブックマーク / fujiringo.sakura.ne.jp (1)

  • 絶対分かる正規表現 ~全角(日本語)を検索する~ | 眉ぼってなかなか変換されない備忘

    英語サイトを作っていたら「全角を検索で見つけ出してほしい」と言われました。 全角の「“」や「‘」が混じっていることもあるためです。 「正規表現 全角」で検索すると [^\x01-\x7E]を使うというページにザクザクヒットします。 [^\x01-\x7E]とは、「全角を探すのは果てしないので、 1バイト文字ではないものを探す」という書き方で、 「x01からx7Eまでの文字以外(^は後に続く文字以外の意味)」という意味です。 では、実際にはx01からx7Eまでの文字って何かというと、 「文字コード accii」で検索すれば下↓のようなサイトにヒットします。 http://e-words.jp/p/r-ascii.html ! ” # $ % & ‘ ( ) * + , – . / 01 2 3 4 5 6 7 8 9 : ; < = > ? @ A B C D E F G H I J K L

    kiyo_hiko
    kiyo_hiko 2016/05/18
    ここの表現とrubyコメント組み合わせて文字列リテラルを辞書ファイルに出すものをregex書いて検索した。コメント除外なら>pt /e "^[^#]*[^\x01-\x7E]"で、しかし"#{'こういうの'}"きにするなら>pt /e "^.*#\{.*[^\x01-\x7E]"こんな感じか。
  • 1