タグ

Unicodeに関するkk42のブックマーク (2)

  • Unicode 文字テーブル - すべての Unicode 記号とそのコードを 1 ページに掲載 (◕‿◕) SYMBL

    「矢印、数学記号、絵文字、象形文字、古代の文字を含む、約50万種類の記号が利用可能です。各記号はテーブル内で指定されたセルに配置されています。ユニコード文字の多種多様なバリエーションを探るためには、下にスクロールしてご覧ください。または、右側のブロックナビゲーションを使うと、各文字ブロックがテーブル内で17の面に分けて範囲を占める様子を確認できます。例えば 🜋 錬金術記号 を試してみてください。気に入った文字にマウスオーバーをするとその名前が表示されるか、それをコピーできます。記号の名前をクリックすると、それを研究するための別のページに進むことができます。」

    Unicode 文字テーブル - すべての Unicode 記号とそのコードを 1 ページに掲載 (◕‿◕) SYMBL
  • 「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記

    自分の知らないCJK Ideographのバリエーションがまだあったことに戦慄している pic.twitter.com/kUlyRLDDTM— moriyoshit (@moriyoshit) March 9, 2017 などというツイートをしたところ、思ったより反響があったのでまとめておく。 上記ではあいまいに「バリエーション」などと書いたが、Unicodeとそれを扱う環境においては、バリエーションと一口に言っても次のような状況がある。 意味論的に等価な異なる字形の集合 同じ字形で異なるコードポイントの集合 aは結構なじみ深いと思う。 a-1. 異なるコードポイントにそれぞれ異なる字形が割り当てられているもの 例: 「東」(U+6771) ⇔「东」(U+4E1C) 「斉」(U+6589) ⇔「齊」(U+9F4A) 「高」(U+9AD8) ⇔「髙」(U+9AD9) a-2. 同じコードポイ

    「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記
  • 1