タグ

ブックマーク / toton.hatenablog.com (1)

  • 「すべての漢字を取り出す正規表現」の続き - totonのブログ

    id:toton:20051102 がはてなブックマークの「最近の人気エントリー」のトップに来ていたため、アクセスが結構あった様子。っちゅーわけでアフターケアとして少し検証してみます。 間違いがあったらヤなのでwww.unicode.orgのUnihan Radical-Stroke Index っちゅーunicodeデータベース検索で「一:U+4E00」と「龠:U+9FA0」の境界を調べてみた。 参考:id:toton:20050120 「一:U+4E00」のコード体系とフォント表示と「龠:U+9FA0」のコード体系とフォント表示 一発で検索できて便利ですね。 ではU+9F00からU+9FFFまでのテーブルを参照しましょう。 9Fのテーブル内で「龠:U+9FA0」を探すのだからA0(最上段の右端)を見ると、U+9FA5まで漢字が存在する。こりゃいかんと思ったが「龠:U+9FA0」はJIS

    「すべての漢字を取り出す正規表現」の続き - totonのブログ
    shunuhs
    shunuhs 2005/11/20
  • 1