[B! unicode] jun_okunoのブックマーク

黄色い絵文字の意図は「ありえない肌の色」　Unicodeコンソーシアム会長、マーク・デイビス博士に聞く

jun_okuno 2015/05/30

unicode

リンク

これからの絵文字の実装指針、UTR #51“Unicode Emoji”とはなにか　

jun_okuno 2015/02/02

unicode

リンク

全角チルダ問題

参考) 確かめかた (Windowsの場合) • 確かめたい文字をコピーします。 • WordPad を起動し、コピーした文字を貼り付けます。 • 確かめたい文字を一文字選択し、ALT + X を押します。 • コード (UCS-4) が表示されます。 • U+301C が波ダッシュ • U+FF5E が全角チルダ基礎知識1) チルダとは何か？ • こういうやつらしい。 ÃÕÑ •鼻音に関する音をあらわす、ダイアクリティカルマークの一種 • ダイアクリティカルマークってこんなやつら (よくしらない) À Á Â Ä Å Ă Ą Ā http://ja.wikipedia.org/wiki/%E3%83%80%E3%82%A4%E3%82%A2%E3%82%AF%E3%83%AA%E3%83 %86%E3%82%A3%E3%82%AB%E3%83%AB%E3%83%9E%E3%83%BC%

jun_okuno 2014/07/07

リンク

バルカン星人のUnicode侵攻 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

そんなわけで、アイルランドがUCS（Unicode）に押し込んだ3つのハンドジェスチャーのうち最後の1つが、これなんだけどね。わあ！　またやばそうなのが来ました！これがやばく見えるなら、それは心の鏡に映ったきみ自身のやばさを見てるんじゃないかな。ちょっと何言ってるかわかんないです。『スタートレック』って観たことある？わりと最近のリメイク版なら観ましたけど。んー、それはリメイク版じゃなくて、映画版の第11作だろうな。まあ、そんなことはいいんだけど、つり眉でおかっぱ頭でエリートくさいスポックっていうバルカン星人が出てきたでしょ？名前は忘れましたけど、いましたね、おかっぱ星人。で、そのバルカン星人のスポックが、手をこんな形にして「長寿と繁栄を！」って言ってなかった？言われてみれば、そんなシーンがあったような、なかったような。それがバルカン式挨拶（Vulcan salute）だ

jun_okuno 2014/06/17

unicode

リンク

Unicode 7.0の仕様公開　新たに約250の絵文字を追加

Unicode Consortiumは6月16日、「Unicode 7.0」を公開したと発表した。このバージョンには2834個の新たな記号が追加されており、その中には約250個の「emoji（絵文字）」も含まれる。Unicodeには前バージョンである6.0で1000個以上の絵文字が組み込まれたが、利用できる絵文字の数がさらに増えた。

jun_okuno 2014/06/17

1F596 は Vulcan salute？ http://en.wikipedia.org/wiki/Vulcan_salute

unicode

リンク

Twitter時代の文字の数え方 | 配電盤

入力「×」のブラウザでは、「𠮷」が2文字とみなされるため、2文字目まで、つまり「𠮷野」までしか入力できません。 Mozillaの文書には、Unicode code pointsで数えると書いてあるので、そのうち改善されるのかもしれませんが、現時点ではTwitterのために「maxlength="140"」を使うことはできません。 pattern属性 Firefox 21とChrome 27、IE 10、Opera 12.15は、「pattern=".{0,3}"」（任意の文字からなる0から3文字）のような正規表現を使った検証にも対応していますが、やはり「𠮷野家」は4文字とみなされてしまいます。 JavaScript 追記：javascript – でBMP以外のUnicode文字をきちんと扱う（404 Blog Not Found） JavaScriptでは、文字列strの長さをst

jun_okuno 2013/03/29

リンク

Unicodeで見る各国の十二支 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

もうすぐお正月だし、こんな図を作ってみたんだけどね。十二支ですか？　いろんな国の十二支？そうそう。実はこれ全部、「どこの国の十二支の何番目の動物」という情報まで含めて、Unicodeのコードチャートに載ってるものなんだよね。いちばん左の列が標準的な十二支ってことですね。うん。日本だと、12番目のイノシシだけが独自仕様だな。それが標準仕様だとブタ。カザフスタンでは、来年の干支はカタツムリですか。よくわからないけど、そうなのかな。このペルシアのネズミは、どうして小さいんですか？　標準仕様のネズミの絵を縮小したみたいに見えますけど。それはネズミの種類が違うんだよ。ドブネズミとハツカネズミ。え？　でもこれ、文字なんだから、たとえばゾウでもアリでも同じ大きさに描かれるものですよね。原則は、そうだね。じゃあ、どうしてドブネズミを縮小したのがハツカネズミなんですか？まあ、ちょっと

jun_okuno 2011/12/28

リンク

どんな人名も正しく表示？ IPAの新フォントを試そう！

どんな人名も正しく表示？ IPAの新フォントを試そう！：OSS界のちょっと気になる話（1）（1/2 ページ）今日から始まるこの連載では、月に1回のペースで近ごろ注目を集めているOSS関連の話題の中から筆者が気になるものを紹介し、技術的背景を解説していこうと思う。連載初回となる今回は、2011年10月26日にIPA（独立行政法人情報処理推進機構）が提供を始めた「≪IPAmj明朝フォント≫」に焦点を当てたい。（編集部）収録字数は6万字「IPAmj明朝フォント」は、2011年10月26日にIPA（独立行政法人情報処理推進機構）が提供を始めたもので、人名に使う漢字を強化ポイントとして、約6万字の漢字を収録したものだ。同じくIPAが提供している「IPAex明朝フォント」のデザインを踏襲しつつ、次の漢字に対応している。戸籍統一文字（5万5267字）住民基本台帳ネットワーク統一文字（1万943

jun_okuno 2011/12/09

font
unicode

リンク

Twitterで見かけるハミ出した顔文字の正体 - RyoAnna

少し前からTwitterで見かけるようになった、上下に飛び出す変な顔文字。気持ち悪いのであまり関わらないようにしていたのだが、この顔文字の謎が明らかになったのでお伝えしたい。いつものようにiPhoneのApp Storeをぶらぶらしていた時のこと。 Unicoder Lite (App Store)というアプリが気になりダウンロードした。起動するとなにやら見慣れた文字が。顔文字でよく使われるギリシャ文字やキリル文字だ。しばらく眺めているとこんな符号が。合成用区分符号これが上と下の行にはみ出す顔文字の正体だった。ためしに作ってみよう。ベースとなる顔文字を置く。左目に合成用区分符号を入れる。続いて右目に。見事にはみ出す。 Unicode（ユニコード）とは、世界中のコンピュータの文字を符号化したもの。その "U+0300-036F" に配置されているダイアクリティカルマー

jun_okuno 2011/06/23

リンク

いいから聞け！俺が文字コードについて教えてやるよその１（前提知識編） - 谷本心 in せろ部屋

ちょっと久々のJavaネタですが、前から書き溜めていた、文字コードやエンコードについてのノウハウを書きます。今回は、詳細な説明に入る前に、前提になる知識や用語について説明しておきます。文字コードとエンコードって違うの？新人くん「では、HTMLの文字コードはUTF-8でお願いします」先輩社員「文字コードじゃなくてエンコーディングでしょ？」新人くん「えっ。あぁ、はい、それで」文字コードとエンコード（エンコーディング）を混同して使ったりすると、ちょっと原理主義的な人に怒られたりするんですけど、大まかに言えば、「文字コード」は文字に割り当てられた「数字」のことで、「エンコード」は文字と数字をマッピングする「方式」のことだと捉えていれば、大きくは外れません。ただ、「文字コード」という言葉は、「数字」「方式」の両方で使われるほか、文字一覧を示す「Charset」という意味で使わ

jun_okuno 2011/06/16

unicode

リンク

「Unicode 6.0」が策定、絵文字が国際標準に

jun_okuno 2010/10/14

リンク

perl - Unicode「'あ'はAlphabetですが、何か?」 : 404 Blog Not Found

2010年04月23日07:00 カテゴリLightweight Languages perl - Unicode「'あ'はAlphabetですが、何か?」結論から言うと、仕様です。 Is "あ" an alphabet? - FloralCompany.log use utf8; print 1 if "あ" =~ /\p{IsAlpha}/; print 2 if "あ" =~ /\p{Alphabetic}/; print 3 if "あ" =~ /[[:alpha:]]/; ﾅﾝﾃﾞﾔﾈｰﾝそれも、PerlではなくUnicodeの。 UAX #44: Unicode Character Database Characters with the Alphabetic property. For more information, see Chapter 4 in [Unicode

jun_okuno 2010/04/30

なるほど。Alphabetic≠英文字、≒字母と捉えればいいのかな。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

unicodeに関するjun_okunoのブックマーク (12)

お知らせ

今週のはてなブックマーク数ランキング（2026年4月第4週）

今週のはてなブックマーク数ランキング（2026年4月第3週）

今週のはてなブックマーク数ランキング（2026年4月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス