タグ

unicodeに関するconsigliereのブックマーク (12)

  • Unicode 13.0 で新しく収録された日本語の漢字|Colorless Green Ideas

    2020年3月にリリースされた Unicode 13.0 では、「日で最も画数が多い字」とも呼ばれる「たいと」という漢字と宮沢賢治の詩の中に出てくる「鏡」を4つ組み合わせた漢字が収録された。また、Unicode 13.0 における部首の例示フォント変更についても触れる。 はじめに Unicode は世界の様々な文字をコンピュータ上で統一的に扱うための国際規格である [1] 。Unicode には毎年のように新しい文字が追加されており、2020年3月にリリースされた Unicode 13.0 では 5,930字が追加されている [2] 。 Unicode 13.0 での漢字の追加 Unicode 13.0 で追加された文字の大半は漢字である。Unicode 13.0 では、漢字 [3] を追加するためにCJK統合漢字拡張G (CJK Unified Ideographs Extension

    Unicode 13.0 で新しく収録された日本語の漢字|Colorless Green Ideas
    consigliere
    consigliere 2020/04/27
    「「日本で最も画数が多い字」とも呼ばれる「たいと」という漢字と宮沢賢治の詩の中に出てくる「鏡」を4つ組み合わせた漢字が収録された」
  • Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加

    Unicode 12では4つの言語(script)、554種類の文字が追加されました。これによりUnicodeに収録されている言語は150、文字は13万7292種類になりました。 追加された文字には日語の文字が7種類、小さな文字としての「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が含まれています(通常の大きさの文字は以前からありました)。これらは古い文書を記述するために使われるとされています。 そのほか、現在のイラン南西部に存在したアケメネス朝で使われていたアラム語のElymaic文字。南インドのサンスクリット語、カンナダ語で使われていたNandinagari文字。ラオス、タイ、ベトナム、フランス、オーストラリア、カナダ、米国などで使われていた現代White Hmong語、Green Hmong語のNyiakeng Puachue Hmong文字。インド、ミャンマー、ブータンの現代Wanc

    Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加
  • モヤイ像の絵文字の話

    https://turingcomplete.fm/12 を聞いていて、モヤイ像について昔ちょっと調べたのを思い出したので掘り起こしてみる。 Unicodeに収録された絵文字のなかに「モヤイ像」というものがある。これ、モアイ像ではなくて “Japanese stone statue like Moai on Easter Island”、つまり「イースター島にあるモアイ像みたいな日の石像」として定義されている。ちなみにモアイ像の絵文字というものはないのであった。マジで? マジで。 モヤイ像というのは東京の渋谷駅のランドマークになっているアレであって(細かく言うと色々あるのだがそれについては後述)、イースター島のモアイ像とは似せたようなかんじであってもまあ違う。髪もあるし。上述リンクの図像もまさに渋谷のモヤイ像のような見た目になっている。どうしてこんなことになっているのだろうか? いっぽう

    モヤイ像の絵文字の話
  • 特殊顔文字に使われている謎の文字よ、お前は一体何者なのか – たぬきフォント

    調査方法 顔文字検索の人気サイト『顔文字屋』に掲載されている、週間顔文字ランキング(2017/11/5~2017/11/11)から上位300種類をリストアップし、そこに使われている各文字について、Unicodeのどのブロックに属しているかを調べました。 三(‘ω’)三( ε: )三(.ω.)三( :3 )三(‘ω’)三( ε: )三(.ω.)三( :3 )ゴロゴロゴロ ( ๑❛ᴗ❛๑)۶♡٩(๑❛ᴗ❛๑ ) ( *¯ ³¯*)♡ㄘゅ ┌(┌^o^)┐ホモォ… ┏○)) アザ━━━━━━━━ス! ((〃’・∀・)ノ”)-ω-`*)ヨシヨシ (っ’-‘)╮=͟͟͞͞♡好き♡ ♡(*>ω<)ω<*)ギュ~ッ♡ ( ˙ө˙) ╰( ^o^)╮-=ニ=一=三 (*˘︶˘*).:*♡ 三└(┐卍^o^)卍ドゥルルル 三┗(┓卍^o^)卍ドゥルルルル (ノ≧ڡ≦)てへぺろ 三(‘ω’)三(

    特殊顔文字に使われている謎の文字よ、お前は一体何者なのか – たぬきフォント
  • 漢字の部首で草冠が最も多いというのは事実なのか | yasuokaの日記 | スラド

    「kusakanmuri」は、日常生活の中で欠かすことができない様々なシーンに合わせて、植物由来成分にこだわったプロダクトをユニセックスに向けて発信していくボタニカルライフスタイルブランド。ブランド名は、「漢字の部首で草冠が最も多いという事実は人々にとって植物が必要不可欠な存在であり、人と植物の密接な関係を表している」という考えに由来しており、ロゴも漢字の部首である草冠(草の字)から着想を得てデザインされた。 確かに『大漢和辞典』第9巻では、「艸」部が、30638「艸」から32673「𧆘」に至っている。第6~7巻の「水」部が、17083「水」から18849「𤆁」なので、「艸」部の方が多そうだ。その一方、私(安岡孝一)の手元の『角川新字源』では、「艸」部が6682「艾」から7079「虆」、「水」部が4049「水」から4549「灧」なので、「水」部の方が多い気がする。うーん、とりあえず、

    漢字の部首で草冠が最も多いというのは事実なのか | yasuokaの日記 | スラド
  • ゟ | だストレージ

    先ずはこの『ゟ』という文字がキチンと表示されているかどうかが不安である。 まあよほど古いPC等でない限り大丈夫とは思うが……。 ある程度高い年代の方々や出版・図書・報道などの業界にいる人、一部の研究者や特定分野の趣味人にとっては馴染みがある文字かもしれない。 ※追記:文中の「ゟ」にもWebフォントで『筑紫明朝』を適用しました。こんな特殊な文字もバッチリ表示される…! FONTPLUSさんありがたい。 I have a よ. I have a り. そもそも私がこれを全く読めなくて調べたことから始まってしまう。 正直、初見はどこか外国語のアルファベットかサンスクリットの文字か何かかと思った……。 これは、2つ以上の平仮名や片仮名などを組み合わせた文字で、『合字』や『合略仮名』と呼ばれるものの一つである。 読みは「より」であり、そのまま平仮名の「よ」と「り」の合字だ。※1 手紙の差出人名や起

    ゟ | だストレージ
    consigliere
    consigliere 2017/01/22
    ゟとか𪜈とか unicode に入っているのか
  • Unicodeの異体字操作に便利なツール「異体字セレクタセレクタ」 - digitalnagasakiのブログ

    今回は、Unicodeで異体字を扱う際の便利ツール、「異体字セレクタセレクタ」のご紹介です。 みなさま、パソコンやスマホ・携帯などで文字入力をする時、最近は特に文字がUnicodeかどうかなど、気にすることもなくなってきていることが多いのではないかと思います。漢字だけでもそろそろ8万字種を超えようとしているような状況で、日常の利用で不便を感じる人はかなり少ないだろうと想像しております。 しかし一方で、Unicodeでは同じ文字だとして「包摂」扱いにされた字形の相違にこだわりを持っておられる方も依然としていらっしゃることと思います。最近は、そのような「文字としては同じだけど字形が違場合」にもきちんとテクストデータレベルで区別できるようにする仕組みが広まってきています。すでにWindowsでもMacでも使えるようです。Unicode Consortiumが提供するこの仕組みは、IVS(Ideo

    Unicodeの異体字操作に便利なツール「異体字セレクタセレクタ」 - digitalnagasakiのブログ
    consigliere
    consigliere 2017/01/18
    これ知らなかったけれどもすごく便利だ
  • The Alphabet That Will Save a People From Disappearing

    As kids, two Guinean brothers invented a new script for their native language. Now they’re trying to get it on every smartphone. Twenty-six years ago, two brothers decided their native language needed a new alphabet. The scripts they’d been using to read and write their native Fulani, an African language spoken by at least 40 million people, weren’t working well. Fulani’s sounds were rendered impr

    The Alphabet That Will Save a People From Disappearing
  • 六点漢字と漢点字の一覧表(小学校で習う漢字、ユニコード点字で) #漢字 #文字コード #点字 – 点字と支援機器ブログ てんじてんぐ@brlat

    普通の点字は仮名だけで表されていますが、点字で漢字を表現する方式として「六点漢字」と「漢点字」があります。 下記は「Unicode(ユニコード)点字」という文字コード・データ形式での元の漢字と、六点漢字、漢点字を並べた一覧です。 もしユニコード点字のフォントが点として表示できる環境になっていれば、画面上で目で見て点字のパターンを確認できます。 Windowsのスクリーンリーダー(画面読み上げソフト)NVDAでは「5の点、3 4 5 6の点」などと読み上げてくれます。またNVDAに対応する点字ディスプレイをパソコンに接続すれば、指で触れて点字を確認できます。 このリストの作成にはMS-DOSの六点漢字変換ソフト sakt.exe、漢点字点訳ソフト EIBRKW、Ascii点字とUnicode点字を変換するperlモジュール Convert-Brailleを使用しました。 1年生 80字 漢字

    六点漢字と漢点字の一覧表(小学校で習う漢字、ユニコード点字で) #漢字 #文字コード #点字 – 点字と支援機器ブログ てんじてんぐ@brlat
  • 変な文字化け - にせねこメモ

    奇妙な文字化けがあった(ことを思い出した)のでメモしておく。 きっかけはこのツイート。twitpicの画像をご覧いただきたい。 何なのこいつ何を入れさせるつもりなの http://t.co/dYFVynv— シェゴ (@syego) September 3, 2011 twitter.com 「悰しい悰惴が倩瀨僯能です」は「新しい更新が利用可能です」が化けた物ではないか。下表にUnicodeスカラ値を示す。 悰 し い 惴 悰 が 60B0 3057 3044 60F4 60B0 304C 新 し い 更 新 が 65B0 3057 3044 66F4 65B0 304C 倩 瀨 僯 能 で す 5029 7028 50EF 80FD 3067 3059 利 用 可 能 で す 5229 7528 53EF 80FD 3067 3059 Unicodeスカラ値を見ると、0x100の位が0に

    変な文字化け - にせねこメモ
  • いま、活版印刷が見直される理由とは? - TYPE

    たかがメガネ、されどメガネ突然ですが、メガネ、お使いですか? はい、あの眼鏡です。私は出かける時はコンタクトなんですが、家ではもっぱらメガネ愛用者ですね。すごく目が悪いので、寝ている時以外はずっとしています。 何個か持っているのですが、いつも使うのは大体決まってます。ちょっと赤っぽい縁の軽量メガネ。黒縁と迷ったのですが、私の場合赤にして正解でした。なんとなくしっくりきてお気に入りです。 皆さんメガネを買うときのこだわりってありますか?私はかけてて痛くならない素材がいいですね。なんせずっとかけてるので、重いとしんどいです。あとはフレームの大きさ。あまり小さいとおかしいし、大きいと重苦しく見えますよね。 メガネ屋さんに行くとあまりに沢山の種類があるので気が遠くなったことありません?私はあります。もうどれでもいい、なんて思っちゃう。でもメガネって、ほぼ体の一部になるものだから、慎重に選ばないとあ

    いま、活版印刷が見直される理由とは? - TYPE
  • graphemica · l♥ve letters

    graphemica · l♥ve letters

    consigliere
    consigliere 2012/02/29
    文字・記号検索
  • 1