タグ

unicodeに関するlatenaのブックマーク (4)

  • 私用面 - Wikipedia

    私用面(しようめん)とは、追加面の一つで、ISO/IEC 10646の第0群第15面と第0群第16面およびUnicodeの第15面と第16面をいう。 概要[編集] Unicodeでは、当事者間の私的な合意によって文字(外字)を定義できる私用領域 (英: Private Use Area, PUA)が用意されている。規格としては、この範囲にいかなる文字も規定していない。私用領域の内容を定義するものとしては、ISOやユニコードコンソーシアム以外の個人、組織およびソフトウェアベンダが想定されている。私用領域に定義された文字を私用文字という。私用領域としては、基多言語面のU+E000–U+F8FF (57344–63743) と第15面および第16面 (U+F0000–U+10FFFF) が用意されている。このうち、私用領域だけに使われる面(すなわち、第15面と第16面)を私用面という。 ISO

  • Unicodeの異体字セレクターを使ったステガノグラフィ:秘密の文字列をテキストにこっそり隠し込む方法 - Qiita

    Unicodeの異体字セレクター(variation selectors)を使い、ユニコード文字列内に隠し情報を埋め込む方法です。 異体字セレクターとは 異体字セレクターは、文字の字体を詳細に指定するモディファイアのようなもの 異体字セレクターは16種類のコードポイントがある(FE00~FE0F) 仕組みの概要 隠したい文字列(hidden)を文字単位にバラす (例: js → j, s) 文字ごとに16進数に変換する (例: j → 6A) その16進数をひと桁ずつ異体字セレクターのコードポイントにマッピングする (例: 6→FE06, A → FE0A) 異体字セレクターの配列をひとつの文字列にまとめなおす 最後にそれを埋め込み先の文字列(body)に混ぜ込んで隠す。 よくあるユニコードステガノグラフィーとの違い ゼロ幅文字を使ったステガノグラフィー 次のようなゼロ幅空白文字を用いたス

    Unicodeの異体字セレクターを使ったステガノグラフィ:秘密の文字列をテキストにこっそり隠し込む方法 - Qiita
  • “𠮟る” と “叱る” | 2014年 | ブログ | hydroculのメモ

    “𠮟る” と “叱る” 2014/12/01 口へんに右が”七”の”𠮟る”と右が”匕”の”叱る”は別々の文字らしい。自分の環境にある仮名漢字変換では”しかる”で変換して、どちらも候補に出てくる。 Unicodeの拡張領域にある文字(符号位置(コードポイント)が16ビットを超え、UTF8では4バイト、 UTF16でも4バイト必要な文字)としては、唯一の常用漢字として、右が”七”の”𠮟”があると知って調べたことのメモ。 “叱”のUnicode符号位置はU+53F1、”𠮟”のUnicode符号位置はU+20B9Fである。前者はJIS規格の第1水準に含まれ、 Shift-JISなどでも表現できるが、後者はJIS規格の第3水準で、ほとんどのShift-JISの実装では表現できない。 2つの文字は、手で文字を書くときには右の第1画の横線を左から書くか、右から書くかの違いがあり、まったく別の文字

  • モヤイ像の絵文字の話

    https://turingcomplete.fm/12 を聞いていて、モヤイ像について昔ちょっと調べたのを思い出したので掘り起こしてみる。 Unicodeに収録された絵文字のなかに「モヤイ像」というものがある。これ、モアイ像ではなくて “Japanese stone statue like Moai on Easter Island”、つまり「イースター島にあるモアイ像みたいな日の石像」として定義されている。ちなみにモアイ像の絵文字というものはないのであった。マジで? マジで。 モヤイ像というのは東京の渋谷駅のランドマークになっているアレであって(細かく言うと色々あるのだがそれについては後述)、イースター島のモアイ像とは似せたようなかんじであってもまあ違う。髪もあるし。上述リンクの図像もまさに渋谷のモヤイ像のような見た目になっている。どうしてこんなことになっているのだろうか? いっぽう

    モヤイ像の絵文字の話
  • 1