タグ

メモと文字に関するtks_periodのブックマーク (4)

  • Twitterで見かけるハミ出した顔文字の正体 - RyoAnna

    少し前からTwitterで見かけるようになった、上下に飛び出す変な顔文字。 気持ち悪いのであまり関わらないようにしていたのだが、この顔文字の謎が明らかになったのでお伝えしたい。 いつものようにiPhoneのApp Storeをぶらぶらしていた時のこと。 Unicoder Lite (App Store)というアプリが気になりダウンロードした。 起動するとなにやら見慣れた文字が。 顔文字でよく使われるギリシャ文字やキリル文字だ。 しばらく眺めているとこんな符号が。 合成用区分符号 これが上と下の行にはみ出す顔文字の正体だった。 ためしに作ってみよう。 ベースとなる顔文字を置く。 左目に合成用区分符号を入れる。 続いて右目に。 見事にはみ出す。 Unicode(ユニコード)とは、世界中のコンピュータの文字を符号化したもの。その "U+0300-036F" に配置されているダイアクリティカルマー

    Twitterで見かけるハミ出した顔文字の正体 - RyoAnna
  • 絵文字を「符号」として処理する難しさ~日本のモバイルウェブのカオスぶり バイドゥ「絵文字の意味検索」ができるまで(1)

  • "&"(アンパサンド)の正しい書き順: 極東ブログ

    はてな」(参照)に寄せられていたアンパサンド(&という記号)についての質問が面白かった。"&(アンパサンド)"の正しい書き順を教えてほしい、というのだ(参照)。 &の書き順を教えて下さい。正確に知りたいので、それを証明するサイトも添えて紹介して下さい。ただ単に個人的な意見はご遠慮下さい。 まいったな、全然わからない。この記号は私も日常使っているし、ちょっとしたプログラムコードのメモ書きとかでも使うのだが、その正しい書き順は?と言われるとまるでわからない。こういうのは当に困った。どきっとする。私は小学生のころ、数字の"5"を上の横棒から先に書いて、それから下の丸みを書いていた。「ら」の要領である。中学生のときに気が付いてなおした。 この質問に寄せられた回答はいくつかあるが率直に言って正答というには遠い。というか、回答のなかにも意見としてあるのだが、正しい筆順はたぶん存在しないのかもしれな

  • Unicode::Normalize で遊ぶ - daily dayflower

    Unicode の規格では,文字の合字(リガチャ等)等を統一的に扱えるように,「正規化」という処理が仕様として定まっています。この正規化処理のうち「互換性分解」という処理を行うと副作用として半角カナを全角カナに変換できます(逆に全角カナ→半角カナはできません)。 #!/usr/bin/perl use strict; use utf8; use Encode; use Unicode::Normalize; my $src = 'ポンジュース'; my $dst = Unicode::Normalize::NFKC($src); print Encode::encode('utf8', "${src} => ${dst}\n"); # OUTPUT is: ポンジュース => ポンジュースUnicode の正規化についてはperl5.8のUnicodeサポート および http:/

    Unicode::Normalize で遊ぶ - daily dayflower
  • 1