Unicode Character Database[UCD] にはコードポイントの番号、名前、その他属性が機械で処理しやすい形式(セミコロン区切りテキスト)で格納されている。 JOINER 系について調べろということみたいなので、気がついたことをメモ。 以前のエントリで、COMBINING GRAHPEME JOINER(CGJ: U+034F) というのに触れたが、名前に JOINER を含むものは、いくつあって、それぞれどういう意味を持つものだろうか。 UCD のキモとなるファイル、UnicodeData.txt を検索してみた。 $ grep JOINER UnicodeData.txt 034F;COMBINING GRAPHEME JOINER;Mn;0;NSM;;;;;N;;;;; 200C;ZERO WIDTH NON-JOINER;Cf;0;BN;;;;;N;;;;; 2