タグ

unicodeに関するnullpobugのブックマーク (3)

  • 「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記

    自分の知らないCJK Ideographのバリエーションがまだあったことに戦慄している pic.twitter.com/kUlyRLDDTM— moriyoshit (@moriyoshit) March 9, 2017 などというツイートをしたところ、思ったより反響があったのでまとめておく。 上記ではあいまいに「バリエーション」などと書いたが、Unicodeとそれを扱う環境においては、バリエーションと一口に言っても次のような状況がある。 意味論的に等価な異なる字形の集合 同じ字形で異なるコードポイントの集合 aは結構なじみ深いと思う。 a-1. 異なるコードポイントにそれぞれ異なる字形が割り当てられているもの 例: 「東」(U+6771) ⇔「东」(U+4E1C) 「斉」(U+6589) ⇔「齊」(U+9F4A) 「高」(U+9AD8) ⇔「髙」(U+9AD9) a-2. 同じコードポイ

    「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記
  • Python3.2はUnicode 6.0に対応した - スコトプリゴニエフスク通信

    Python has been updated to Unicode 6.0.0. The update to the standard adds over 2,000 new characters including emoji symbols which are important for mobile phones.In addition, the updated standard has altered the character properties for two Kannada characters (U+0CF1, U+0CF2) and one New Tai Lue numeric character (U+19DA), making the former eligible for use in identifiers while disqualifying the l

  • チェックボックスのマーク - swk's log

    * チェックボックスのマーク [tech] 9 users 提出書類とかで「□ をチェックしろ」という場合がよくある.メールの返信みたいに plain text の場合は,迷わず「■」に書き換える. あなたの身分を選んでください. □ 教職員□ 大学院生□ 学部学生■ メロンパン□ その他 ところが MS Word での提出や紙での提出のときは,「レ」印を入れろと明記されている場合がたまにある.んで,今までは「図形描画」で折れ線を引いてみたりとか,印刷してから手書きで書いてみたりとか,手書きで書こうと思って印刷したまま書き忘れて送っちゃったりとか,いろいろやってたわけなのだけど,つい最近 Unicode にこんな文字があるのを教えてもらった. ☐ (2610) ballot box ☑ (2611) ballot box with check MS Word の場合,挿入 - 記号と拡張文

  • 1