タグ

opnepneに関するamerica66のブックマーク (1)

  • "http://"の欠けた日本語入りURLの正規表現 - かすてらすねお。

    タイトルだけでは想像しにくいと思うので、具体例を挙げます。「hrio.edoblog.net/開発メモ/is05でデバッグするまでの奮闘記」は日語が含まれているURLで、尚且つ"http://"が欠けています。このような形のURLはTwitterの自動短縮でよく見かけると思います。このURLに一致する正規表現を考えてみました。 /([\w*%#!()~\'-]+\.)+[\w*%#!()~\'-]+(\/[\w*%#!()~\'-.]+)*/u 長いですね。ちょっとずつ見ていきましょう。 [\w*%#!()~\'-]+\. "[ ]"内に列挙された文字は、URLに使用可能な文字のうち、区切り文字や特定の意味や役割を持つ文字を除いた文字です。""の直後の"+"は「直前の文字が1個以上繰り返される」という意味で、1文字以上の文字列を表す事ができます。その後ろの"\."は、"."(ドット)を表

    "http://"の欠けた日本語入りURLの正規表現 - かすてらすねお。
  • 1