タグ

2011年11月6日のブックマーク (2件)

  • Unicode一覧 0000-0FFF - Wikipedia

    この一覧は、U+0000からU+0FFFまでのUnicodeコードの一覧である。YYY0行X列のコードはU+YYYXであり、HTML文字参照は&#xYYYX;である(環境により表示が異なる場合がある)。 各文字の範囲についてはUnicodeのブロックの一覧を参照。 この項目には、一部のコンピュータや閲覧ソフトで表示できない文字が含まれています(詳細)。

    a_bicky
    a_bicky 2011/11/06
    去年だとここまで綺麗にまとまったものはなかった気がする!
  • Twitterの日本語ハッシュタグ抽出する正規表現 · Real Beat

    正式に日語ハッシュタグが使えるようになったので、色々ためした結果、以下の正規表現でほぼ公式と同じ動作になった。「ほぼ」なのはちゃんとテストしたわけじゃないので。使うなら自己責任でどうぞ。 sourcecode language=“text”([a-zA-Z0-9_\u3041-\u3094\u3099-\u309C\u30A1-\u30FA\u3400-\uD7FF\uFF10-\uFF19\uFF20-\uFF3A\uFF41-\uFF5A\uFF66-\uFF9E]+) ``` iPhoneの公式クライアントだとなんか動きが違ったりするし、half-widthのカタカナ半濁点はだめだったりとかなんかバグなのか仕様なのかよくわからず。半濁点も通すようにしたければ、FF9EをFF9Fにすればおk。 Tweet

    a_bicky
    a_bicky 2011/11/06
    数字で始まるとタグとして認識されないことと、軽く試したところ #ー がタグとして認識されないこと、#@ がタグとして認識されることとか若干違うけどありがたく使わせてもらう