タグ

unicodeに関するFeZnのブックマーク (25)

  • Apple絵文字は間違ってる? - Ryusei’s Notes (a.k.a. M59のブログ)

    Apple絵文字の問題 iPhone 3Gが絵文字に対応したのが2008年11月、Unicodeに絵文字(Emoticons)が入ったのが2010年10月でした。それから時がたって2014年、今では世界中で絵文字が使われています。英語圏で「ホットドッグの絵文字がない!」「黒人がいないのは差別じゃないか?」などが話題になると、日語圏では「emojiが英語になってる? 知らなかった!」なんていう話題になったり。今ではOS XもWindowsAndroid絵文字に対応しています。Unicodeだから、誰とでも絵文字やり取りし放題。バリバリ使っちゃうぞー!? ところが、実は大変な問題がありました。Apple絵文字が、Unicodeのコードチャートと異なっているのです。 Unicodeや他のフォントと異なるAppleカラー絵文字 左: The Unicode Standard, Versio

    Apple絵文字は間違ってる? - Ryusei’s Notes (a.k.a. M59のブログ)
  • 最近、モリサワのようすがちょっとおかしいんだが。 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    ところで、モリサワのPr6Nフォントがやばいらしいですね。 twitterで話題になってたね。 まとめを読んでも、ちょっとわかりにくかったんですけど、どういうことなんですか? リュウミンとかのPr6/Pr6Nには複数のバージョンが存在して、新バージョンで作ったデータを旧バージョンの環境で開くと、豆腐になっちゃう文字があるんだよね。 うー、それはかなりイヤですね。 だよね。新バージョンのほうは、IVS(異体字シーケンス)対応版なんだけど、cmapも新しいのになってるから。 しーまっぷ? cmapっていうのは、符号位置とグリフの対応表。DTP用の日語OpenTypeフォント(Adobe-Japan1フォント)には、Unicodeに入ってないグリフもたくさん入ってるでしょ。 入ってますね。 「Unicodeに入ってない字」はcmapには載ってない。でも、そういう字が後からUnicodeに収録さ

    最近、モリサワのようすがちょっとおかしいんだが。 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 住民基本台帳ネットワーク統一文字とその 問題点

  • マイクロソフト - PressPass ホーム - 製品画像ダウンロード

    すべての Microsoft 製品 Global Microsoft 365 Teams Copilot Windows Surface Xbox セール 法人向け サポート ソフトウェア Windows アプリ AI OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入する アクセサリ VR & 複合現実 エンタメ Xbox Game Pass Ultimate Xbox Live Gold Xbox とゲーム PC ゲーム Windows ゲーム 映画テレビ番組 法人向け Microsoft Cloud Microsoft Security Azure Dynamics 365 一般法人向け Microsoft 365 Microsoft Industry Microsoft Power Platform W

  • 使える漢字、6倍の5万6000字に マイクロソフト - 日本経済新聞

    マイクロソフト(MS)は、人名や地名で使用される異体字をパソコン上で表示できる専用ソフトを開発した。現在パソコンで変換して表示できる漢字は約1万文字だが、同ソフトを使えば約5万6000文字が表示できる。戸籍などで氏名を登録する際、特別に作成する必要があった異体字を簡単に使えるようになる。今月中に異体字の取り扱いができる専用ソフトを無償提供する。IPA(情報処理推進機構)が公開する

    使える漢字、6倍の5万6000字に マイクロソフト - 日本経済新聞
  • 日本の文字とUnicode 第11回 | 大修館書店 WEB国語教室

    現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日語に特化して作られたわけではないので、日の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、第11回は、記号や絵文字とUnicodeの関係です。 Unicodeには、かなり多くの記号や絵文字が収録されています。それらの記号や絵文字は、世界中の色々な用途、印刷や標識や時計やケータイなど、様々なものから集められていて、それらが雑多に収録されている状態です。したがって、これらの記号や絵文字は、必ずしも特定の言語に依存しているのではないのですが、日でよく使われるものも

    FeZn
    FeZn 2012/10/26
  • UTR50(Unicode縦書きの文字の向き仕様)標準化のために (CSS組版ブログ)

    ツイッターでの議論(ハッシュタグ #UTR50)のまとめサイト: UTR#50(Unicodeの縦書きの文字の向き)の話題 #UTR50 議論は主に2つあると思います。 SVO(英数字正立)の議論 ひとつはUTR50が定義しようとしている2つの縦書きモード SVO(Stacked Vertical Orientation = 英数字も正立)およびMVO (Mixed Vertical Orientation = 英数字は横倒し)のどちらが日語の縦書きのデフォルトの文字の方向として便利であるかということ。今朝の @TokKoba (小林徳滋@アンテナハウス)のツイート: 「英数字正立論」を「SVOを基とするコンテンツマークアップのすすめ」という題名に変更しようかと思案中。横書きした文書を縦書きで表示したとき、できるだけそのまま読め、かつ、マークアップが容易という点で、MVO方式よりSVO

    FeZn
    FeZn 2012/08/02
    なるほどようやく理解した。
  • 日本の文字とUnicode 第5回 | 大修館書店 WEB国語教室

    現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日語に特化して作られたわけではないので、日の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、第4回に引き続き、第5回も、漢字とUnicodeの関係です。 Unicodeでは、「清」と「淸」はU+6E05とU+6DF8に分離して収録されているのに、「晴」と「晴」はU+6674に統合されている、というお話を前回いたしました。でも、「晴」と「晴」を別々の文字コードで表したい、という要望は当初からあって、いくつかの方法が実際に試されてきました。カナダが提案した「互換漢字

  • 第2回 アルファベットとUnicode|安岡孝一 連載 日本の文字とUnicode|大修館書店 WEB国語教室

    現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日語に特化して作られたわけではないので、日の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、第2回は、多彩なアルファベットとUnicodeの関係です。 Unicodeには、同じ形に見えるアルファベットが、数多く収録されています。 たとえば、U+0041「A」と同じ形に見えるアルファベットとしては、 U+0391「Α」やU+0410「А」が収録されているのです。 どうしてこんなことになっているのでしょう。 端的に言えば、U+0041はローマ字の「A」なのに対して、

  • Unicodeのキャラクターを手書きで識別してくれる『Shapecatcher』 | 100SHIKI

    ニーズがあるかといえば微妙だが、アイデアはおもしろいのでご紹介。 Shapecatcherを使えば、手書き認識でUnicodeのキャラクターを調べることができる。 このキャラってどこの言語の文字だっけ?なんてときに便利(かもしれない)。 ただ残念なお知らせなのが、日語、中国語、韓国語のキャラはサポートされていない点だ(まぁ、しょうがないかもしれないが)。 いつか使うかもしれない、という意味で覚えておいてもいいかもですな。

    Unicodeのキャラクターを手書きで識別してくれる『Shapecatcher』 | 100SHIKI
    FeZn
    FeZn 2011/12/09
    >"日本語、中国語、韓国語は未サポート" 漢字の異体字云々には使えぬのか。ふむむ。
  • 半角濁点の編集上の扱いについて

    結合文字ではない半角片仮名の濁点(U+FF9E)が、カーソル移動/削除で前の文字と一まとめになる現象とその理由について。IVSも同じ扱いだということです。

    半角濁点の編集上の扱いについて
  • 絵文字が開いてしまった「パンドラの箱」第5回--絵文字と日本マンガの親密な関係

    絵文字の収録をめぐって、国際規格で大論争--「Google提案」を振り返る 皆さんこんにちは、面白くてタメになる(?)文字コード漫談の時間がやってまいりました。2月からとびとびで書いてきた絵文字の報告も、いよいよ今回が最終回。どうかよろしくお付き合いください。 さて、前回はどこまでお話ししたのでしたっけ。日絵文字をUnicodeに収録しようとするGoogleAppleによる提案(以下、主導者の名をとりGoogle提案と略)ですが、去年の12月にパブリックレビューが開始されると、Unicode-MLで時ならぬ非難の嵐が吹き荒れたこと。そこでの反発を一言で言い表すなら、日文化に強く依存する絵文字を単純に国際規格に収録しようとした点にあったこと。 なぜなら国際規格の審議は参加各国の総意で成り立っており、特定の国しか便利に使えない文字を収録することは、当然強い反対をうけるからです。さらに

    絵文字が開いてしまった「パンドラの箱」第5回--絵文字と日本マンガの親密な関係
    FeZn
    FeZn 2010/03/19
    clipし忘れてた模様。
  • なぜUnicodeには分数の「0/3」が入っているのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Adobe-Japan1の分数は(特にUnicodeとの関係において)けっこうぐしゃぐしゃなので、ちょっと整理してみよう。下図は、横棒を使う分数のリスト*1。Proフォントでは「分数(afrc)」フィーチャで用いられる。分母が2から12までの約分できない真分数と「0/3」と「1/100」。 上図と同じ字種について、数字を斜めに配置するグリフも用意されている(下図)。これらはProフォントでは「スラッシュを用いる分数(frac)」フィーチャで用いられる*2。 上図のグリフはすべて全角だが、斜めに配置する分数の一部には、プロポーショナル・グリフも用意されている(下図)。 下図は、Unicodeに含まれる分数を、Mac OS Xの文字ビューアからInDesignに入力したもの。Adobe-Japan1ではプロポーショナル(黄色地)優先のマッピングであるため、「2/5」などの全角グリフ(グレー地)

    なぜUnicodeには分数の「0/3」が入っているのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • なぜ全角ダッシュは欧文約物形状になったのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    あさうすさん(実験る〜む)の「和文としてのダーシが変」を読んで、Adobe-Japan1フォントの全角ダッシュが和文約物形状ではなく欧文約物形状で表示される理由について考えてみた。このエントリでは、JIS X 0208の1区29点「ダッシュ(全角)」を「全角ダッシュ」と呼ぶこととする。 昔は、全角ダッシュの実装グリフは和文約物形状だった。今ではたいていの場合、欧文約物形状。どちらになるかは、「文字コードがUnicodeか否か」による。たとえば小塚明朝Pr6Nのような新しいフォントでも、Shift-JISアプリでは全角ダッシュは和文約物となる。また、(試していないけれど)CIDフォントでもUnicodeアプリでは全角ダッシュは欧文約物となるはず。 Shift-JISとUnicodeでグリフが変わるのは、全角ダッシュだけではない。たとえば、セント記号について見てみよう。JIS X 0208は、

    なぜ全角ダッシュは欧文約物形状になったのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 絵文字が開いてしまった「パンドラの箱」第6回--Google・Apple提案とそのシナリオ

    WG 2ダブリン会議に持ち込まれた絵文字の提案 2009年4月21日火曜日、ここはイギリスのお隣、アイルランドの首都ダブリン郊外です。広大なキャンパスをかまえるダブリン・シティ大学の一画では、前日から11カ国のナショナルボディ(以下、NB)と2つの組織のリエゾンメンバー(連絡担当会員)が集まって、第54回WG 2会議が開かれていました。 大学の正門から真っ直ぐに延びた広い道を100メートルばかり行った突き当たりに、巨大なる工学部校舎が建っています。その建物の奥深く、2階にあるミーティングルームでは、先ほどから重苦しい空気が立ちこめていました。 ここで開かれていたのはWG 2の会議ではなく、特定のテーマを扱うアドホック会議です。「Ad-Hoc Committee on Emoji Encoding」(以下、Emojiアドホック会議)。──そう、2月のUTC会議を無事に通過したGoogle

    絵文字が開いてしまった「パンドラの箱」第6回--Google・Apple提案とそのシナリオ
  • 漢字1文字が最大8バイト、Unicodeの「IVS」とは?

    「漢字1文字は2バイト」という常識が、大きく変わろうとしている。現在改正中の「常用漢字表」に対応するためには、Unicodeの4バイト文字を使用する必要があるが、それだけでは済まない恐れがある。今後、戸籍や住民基台帳で使われている文字がUnicodeに追加されると、漢字1文字が最大8バイトになるかもしれない。文字コードに詳しい京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。(日経コンピュータ) 先日公開した『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』の読者から、「今後のシステムでは漢字1文字を最大4バイトで処理すればいいのか」という質問を頂いた。実は、UTF-8あるいはUTF-16で漢字を表す場合、最新のUnicodeにおけるIVS(Ideographic Variation Sequence)を考慮すると、漢

    漢字1文字が最大8バイト、Unicodeの「IVS」とは?
    FeZn
    FeZn 2010/01/29
     安岡先生レベルの詳細丁寧な解説だなぁと思ったら例によって御本人だったの巻。
  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
  • ファイル名は「左から右に読む」とは限らない?!

    ファイル名は「左から右に読む」とは限らない?!:セキュリティTips for Today(8)(1/3 ページ) 私たちの常識が世界では通用しないことがあります。攻撃者はそんな心のすきを狙って、落とし穴を仕掛けます。今回はそれを再認識させるかのような手法と、その対策Tipsを解説します(編集部) 皆さんこんにちは、飯田です。先日、セキュリティ管理者の方々と「今後のウイルス対策のあり方」について意見交換をする機会がありました。参加者からは活発な意見や質問も飛び交い、盛り上がりを見せた意見交換会となりました。私自身も多くの気付きや学びを得ることができ、貴重な時間を過ごすことができました。 その意見交換会の中で、Unicodeの制御文字を利用したファイルの拡張子偽装の話題が出ました。この手法は目新しい手法ではなく、数年前からすでに指摘されていたものです。しかし、久しぶりに手法について議論するこ

    ファイル名は「左から右に読む」とは限らない?!
    FeZn
    FeZn 2009/09/30
  • 絵文字原稿の第5回が公開中 - もじのなまえ

    今朝から公開されています。 絵文字が開いてしまった「パンドラの箱」第5回--絵文字と日マンガの親密な関係 夕方5時の時点でソーシャル・ブックマークが93ですか。このお盆休みで、世の中はエントロピーを下げる一方であることを考えれば、まあ健闘している方ではないでしょうか。しかし当にみんなに読んでもらえるのかな。 ところで編集部には送ったのですが、まだ反映されていない様子なのでここで告知します。 - ◎お詫びと訂正(8月12日) 5ページの図10のうち、アイルランド・ドイツ提案1F619の絵文字が間違ったものを掲載していました。これを修正するとともに、5ページの文を以下のように変更します。お詫びして訂正します。 ・訂正前 1F619は目と口の形が違う ・訂正後 1F619は目の色が違う

    絵文字原稿の第5回が公開中 - もじのなまえ
  • 絵文字が開いてしまった「パンドラの箱」第2回--Googleの開けてしまった箱の中味

    じつはコメントを送っていたNTTドコモ 最初に前回のおさらいをしておきましょう。スタート当初の携帯電話の絵文字には、キャリア間でメールのやり取りの中で文字化けしてしまう欠点があったこと、それを解決する仕組みをキャリア各社が作ったものの、その場しのぎの欠点の多いものであったこと、そして絵文字のUnicode符号化というのはそうした欠点を一挙に解決するはずであること。ついでにGoogle絵文字のUnicode符号化を進めることで、キャリア各社は今まで自分たちが育ててきた絵文字の主導権を奪われてしまうということも。 それから前回の最後では、キャリア各社に対してGoogleの提案についてどう思うか、パブリックレビューに参加する意向があるかを聞いてみました。そこでの回答は、各社そろって消極的と受け取れるものでした。 ところが前回の掲載後に、NTTドコモがGoogle絵文字メーリングリストに投稿し

    絵文字が開いてしまった「パンドラの箱」第2回--Googleの開けてしまった箱の中味
    FeZn
    FeZn 2009/03/11
     あれれ?「小形さん以外にも、こういうところに書く人で、詳しい人が居るんだなぁ」と思ったら本人だった。ある理由から「違う」と思ったんだけど。/あぁ、原稿書いたのと掲載時にタイムラグがあるのか。