タグ

Unicodeに関するd5884のブックマーク (6)

  • Unicode6.0の携帯電話の絵文字の一覧 - Wikipedia

    この項目には、一部のコンピュータや閲覧ソフトで表示できない文字(Unicode 6.0の絵文字)が含まれています(詳細)。 Unicode6.0の携帯電話の絵文字の一覧(ユニコード6.0のけいたいでんわのえもじのいちらん)では、2010年制定のUnicode 6.0 で採用された携帯電話の絵文字Emoji)の一覧と、携帯キャリアごとの対応状況について示す。 Unicode 6.1 では、文字コードを絵文字スタイルとして扱うか、テキストスタイルとして扱うかの異体字セレクタが用意された[1]。絵文字スタイルの場合は、U+FE0Fを、テキストスタイルの場合は、U+FE0Eを文字コードの後に記述する。このため、理論上は多くの文字コードに絵文字スタイルを適用することが出来るが、Unicodeでは、これらを絵文字歴史的コードとしている。 各キャリア別の表はiモード絵文字、EZweb絵文字、Soft

  • EmacsWiki: Unicode Fonts

    d5884
    d5884 2012/08/23
    多分使わないけど hello が充実すると嬉しい
  • UTF-8 Sampler

  • Unicode Utilities: UnicodeSet

    Unmarked properties are from Unicode V15.1.0; the beta properties are from Unicode V16.0.0β. For more information, see Unicode Utilities Beta. help | character | properties | confusables | unicode-set | compare-sets | regex | bnf-regex | breaks | transform | bidi | bidi-c | idna | languageid Input

  • Emacs22 + UTF-8 における文脈依存な文字幅の問題について

    UTF-8 には文字の幅が文脈依存 (ambiguous) となる文字があって、 矢印や記号 (■▲)、罫線などの文字は状況に応じて文字幅が変化します。 下の 2 つの画像は Emacs で同じファイルの内容を narrow character として判定させた場合と、 wide character として判定させた場合のスクリーンショットです。 narrow wide 現状、 Emacs22 はこれらの文字をデフォルトで narrow character として判定します (※のように化けてしまう文字もあります)。 文字によって幅を変えるプロポーショナルフォントを前提としたテキストであれば あまり問題にはならないと思いますが、等幅フォントに向けて書いたテキストでは 表示がガタガタになってしまい問題になります。 これらの文字を wide character として判別させるには以下の設定を

  • 機種依存文字とUnicode - WebStudio

    導入 機種依存文字と呼ばれる文字があります。 例えばWindowsでは、 大文字のローマ数字(ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ)、 小文字のローマ数字(ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ)、 丸囲み数字(①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳)、 丸囲み文字(㊤㊥㊦㊧㊨)、 カタカナ表記の単位(㍉㍍㌔㌘㌧㌦㍑㌫㌢)、 単位記号(㎝㎏㎡)、 複数のアルファベットを合成した文字(㏍℡№)、 元号(㍻㍼㍽㍾)、 会社名等で用いられる括弧囲み文字(㈱㈲㈹)等が機種依存文字と呼ばれています。 機種依存文字は一般的に、異機種間でデータの交換を行った場合、 例えばWindowsで作成したテキストファイルをMacintoshで表示した場合に文字化けしてしまうので、 これら異機種でデータ交換することを前提としたインターネットでは利用するべきではないと言われています。 しかし、これらは機種依存文字と呼ばれているものの、 その意味はあ

  • 1