タグ

languageと絵文字に関するmyrmecoleonのブックマーク (2)

  • 絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama

    UnicodeのUTF-16エンコーディングではほとんどの文字(コードポイント)は2バイトで表現されるが、Unicodeに後から追加収録された文字の多くは4バイトで表現される。4バイト文字がうまく扱えないプログラムというのはわりとよくある。しかし世界中で広く使われるようになった絵文字がよりによって4バイト文字であるせいで、そのような文字が扱えない問題がよいペースで解決に向かいつつある。それについて少し説明してみようと思う。 Unicodeが80年代から90年代初頭にかけてデザインされたときの目標の一つは、Unicodeに含まれる文字数を65536個以内に収めることだった。現代の文章を実用的なレベルで表すためには、漢字などを含めてもそれだけの種類の文字があれば十分だと考えられたのだ。当然これは1文字を2バイトで表すことを念頭に置いていた。つまりコンピュータの揺籃期から当時に至るまで単純に英語

    絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama
    myrmecoleon
    myrmecoleon 2017/11/14
    絵文字すごい。世界中のプログラマさんおつかれさま。
  • お願い:この絵文字に似たマンガのコマを送ってください - もじのなまえ

    ただ今、ISO/IEC 10646の追補草案として審議中のFPDAM8への修正提案を作成中です。以前このグログでもご報告したように、去年10月に開かれた東京会議でも修正提案を提出したのですが、そこで直しきれなかったものを、再度修正するよう促すものです。 今回の修正提案でも、われわれが提案する絵文字のデザインの根拠としてマンガ表現を提示しようと思うのですが、これはというマンガを探し当てるのは想像以上に時間がかかるものです。 そこでお願い。以下の絵文字のソースとして提示できるマンガのコマをお送りいただけないでしょうか。 要するに、上記の絵文字によく似たマンガのコマを送ってほしいのです。左側の「勝ち誇り」は鼻息を吹き出して勝ち誇っている様子を描いたもの。右側は、目を細め片頬をゆがめて「フッ」と冷笑している様子。 いずれもごくありふれたマンガ表現ですが、いざ似たコマを探そうとすると、そう簡単なこと

    お願い:この絵文字に似たマンガのコマを送ってください - もじのなまえ
    myrmecoleon
    myrmecoleon 2010/02/08
    「絵文字のデザインの根拠としてマンガ表現」ほんほん。たくさんありそうな気はするなー
  • 1