日本がCJK統合漢字拡張F1/F2に提案している文字には、すでにUCSに入っている漢字と見分けがつかない例がいくつもある。これらは、提案書*1に「Similar and Variation」として既存の文字の符号位置が記載されているものの一部であり、つまり、似ている漢字の存在は百も承知で提案しているわけだ。 以下、そのような例を拾ってみた。左右に並べた文字のうち「UCS」欄に符号位置が入っているほうが、既存のもの。個々の文字について述べることはしないが、要するに「別字の衝突であれば、形が同じでも別の符号を与える」ということだろう。 だが、ちょっと待ってほしい。それって実はものすごく根本的な方針転換じゃないですか? 「機」の簡体字の「机」も「つくえ」の「机」も、形が同じである以上、同じ符号位置(U+673A)に包摂・統合するというのがCJK統合漢字の大原則であったはず*2。ここでいきなりそれ
MSのセミナー「Windows 8 で変わる文字 - 異体字と Unicode IVS〜 情報システムにおける日本語処理 〜」に行ってきました! ついにWin8でIVSを扱えるようになったということで、Win8がIVSにどういうふうに対応しているのか?もっというとそこで入力されたIVSテキストが入稿されたらどうなるのか?というあたりが知りたくて、参加してきました。 (私のブログを見る人の興味は主にDTPに関わるとどうなるか、というところでしょうから、そこは最後にまとめてます。途中の話がややこしくてわからんという方は最後だけお読みください。) 主に開発者を対象に、文字の基礎知識から最新Win8でのIVSの取り扱いまでを説明しますというこのセミナー、予定されているセッションコンテンツを見ると 文字コード基礎知識 マイクロソフトと Unicode の歴史 JIS、Unicode などの文字集合と
KDDIが、5月上旬からauのEメール(~@ezweb.ne.jp)とSMS(Cメール)の絵文字デザインをリニューアルする。今回のリニューアルは、NTTドコモ、KDDI、沖縄セルラー、イー・アクセスが発表した、事業者間の絵文字共通化に向けた取り組みに基づくもの。 →イー・アクセスがイー・モバイル向け絵文字をリニューアル →絵文字の共通化、ソフトバンクモバイルは? リニューアルにより、auの絵文字はドコモのiモードメールとspモードメールで使われている絵文字をベースにしたデザインに変更される。これにより、au、ドコモ、イー・モバイル、ウィルコム端末で同じ絵文字を使えるようになる。共通化されるのがドコモで使われている213個の絵文字。イー・モバイルとの共通化については近日対応予定。 ドコモの絵文字にないau絵文字は、ドコモ絵文字を基調にしたデザインで新たに制作する。ドコモ絵文字との統一感を図る
サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。
IVS技術促進協議会のセミナー「Unicodeの基礎知識と異体字について」があったので、ちょっと聴きに行ってみた。 Unicodeの基礎知識と異体字について主催:IVS技術促進協議会 後援:日本電子出版協会、電子出版制作・流通協議会 内容 (1)Unicodeに関わる用語や基礎知識、IVSについてご説明します。 講師:Unicode Consortium Director 小林 龍生 氏 (2)外字・異体字に関するプロジェクト等についてご説明します。 講師:凸版印刷株式会社 情報コミュニケーション事業本部 田原 恭二 氏、総合研究所 秋元 良仁 氏 セミナー情報|IVS技術促進協議会 以下、ざっとレポート。スライドのPDFとあわせてどうぞ。 (1) IVS時代の文字コード入門 スライドPDF charater glyph model 最初に character(「文字」)と glyph(「
どんな人名も正しく表示? IPAの新フォントを試そう!:OSS界のちょっと気になる話(1)(1/2 ページ) 今日から始まるこの連載では、月に1回のペースで近ごろ注目を集めているOSS関連の話題の中から筆者が気になるものを紹介し、技術的背景を解説していこうと思う。連載初回となる今回は、2011年10月26日にIPA(独立行政法人情報処理推進機構)が提供を始めた「≪IPAmj明朝フォント≫」に焦点を当てたい。(編集部) 収録字数は6万字 「IPAmj明朝フォント」は、2011年10月26日にIPA(独立行政法人情報処理推進機構)が提供を始めたもので、人名に使う漢字を強化ポイントとして、約6万字の漢字を収録したものだ。同じくIPAが提供している「IPAex明朝フォント」のデザインを踏襲しつつ、次の漢字に対応している。 戸籍統一文字(5万5267字) 住民基本台帳ネットワーク統一文字(1万943
小形克宏 @ogwata #IVS飲み会 に向けて、UTS#37 を頭から読み直してみた。今さらな疑問かもしれませんが、“registration authority” がUnicodeコンソーシアムであるのはよいとして、“registrar” は具体的に誰になるのでしょう? ご存知の方、お教えください。 2011-10-11 02:47:14 小形克宏 @ogwata というのは、相似のグリフを登録しようとした場合、〈レジスターは登録者にシーケンスを共有する可能性に対して警戒を促すべきである〉(2 Description)という一文があるのだけど、この警戒を促すのは、具体的に誰になるのかしら? と。 2011-10-11 02:56:39
iPhone 用の新しい OS となる iOS 5 では Unicode 処理についても多くの新機能・新文字が追加され,Mac OS X Lion で採用された Unicode 絵文字(Apple カラー絵文字)にも完全対応するようになりました。ここでは Uncoder と Emojicoder アプリの応用例を中心に,iOS 5 の Unicode 活用術とカラー絵文字活用術についてまとめました。 ・iOS 5 の Unicode 機能や絵文字を最大限に活用するには以下のアプリをご利用下さい☟ Unicoder Lite(無料)http://j.mp/qzogT6 Unicoder Pro(¥350)http://j.mp/o7QpKC Emojicoder Pro(¥85)http://j.mp/uL3h6O 続きを読む
現時点でのAppleカラー絵文字フォントは、フォーマット上はttfでありながら、「glyf」テーブルに絵文字を含んでおらず、代わりにアヤシゲな「sbix」というテーブルを含んでいる。この「sbix」のフォーマットは、今のところ公開されてないみたいなので、私(安岡孝一)の推測をここにメモっておく。 ULONG version (たぶんsbixのバージョン、現状では0x00010001) ULONG numImageTables (画像テーブルの個数) ULONG OffsetTable[numImageTables] (各画像テーブルへのオフセット) 各画像テーブルは、以下のようなフォーマットになっているようだ。 USHORT height (画像の高さ(ピクセル数)) USHORT DPI (現状では0x0048すなわち72dpi) ULONG ImageOffset[numGlyphs+
「あとはフォントをAppleカラー絵文字に変えるだけ」の図をInDesignで作ってLionを待ちかまえていたのだが、実際にやってみると、Adobeアプリではカラーの絵文字は表示されないようだということがわかったので、PDFを貼り込んだりして作り直したのが、以下の図。 各文字の左上に記したのが、Unicode絵文字の符号位置。その下の青字は、iOSが利用している私用領域(PUA)の符号位置。この青字の符号位置が記されている文字が、現状のiOS互換。これらの文字は、LionのAppleカラー絵文字でもカラーで表示できる。 黒字の符号位置は、(Softbank以外も含めた)日本のキャリアのケータイ絵文字をソースとするもの。ざっと見たところ、これらの文字のうちiPhone絵文字をソースとしないものは、ほぼ「モノクロの絵文字」としてサポートされているようだ。このうち以下の図で濃いグレーとなっている
普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。 (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ
普通では考えられない優遇策--「Google提案」を振り返る 皆さんこんにちは、毎度おなじみ(?)文字コード漫談の時間がやってまいりました。前回が3月の掲載ですから3カ月ぶりですか。今まで3回にわたって絵文字をUnicode及びISO/IEC 10646(国際符号化文字集合)に収録しようという提案の動きについてご説明してきましたが、今回から2回に分けて完結編をお届けします。どうぞよろしくお付き合いください。 ひさしぶりですから、ここまでのポイントを整理しておきましょう。前述した「提案」とは、もともとはUnicodeに収録するためにGoogleがAppleと共同で作成したものです。以下、主唱者の名前をとり「Google提案」と呼ぶことにします。これはこの2月に開かれた最高議決機関、UTC会議で承認されてUnicodeコンソーシアムの総意となりました。ついでGoogle提案はISO/IEC 1
2009年04月02日16:00 カテゴリCodeArt デバッグより重要なもの この話題、すっかり乗り遅れてしまった。 2009-03-22 - 未来のいつか/hyoshiokの日記 プログラミング入門書では、デバッグについて、ほとんど議論されていないし、仮にふれられていても、おざなりな方法というか、かなり邪険にあつかわれていたりする。プログラマの多くの時間がデバッグについやされていたとしてもだ。 あえていわせていただく。コードはデバッグできるだけはるかにましなのだ、と。printfを使うかどうかなんぞ、その問題と比べれば屁ですらないのだと。 デバッグよりもはるかに重要なもの、それはデータ構造の選定。 ここで一歩間違えると、バグが仕様化し、デバッグどころかバグにあわせてプログラムを書かねばならぬ羽目になる。 その最も顕著な例が、Unicodeだろう。最初の設計を間違えたおかげで、最新のソ
前回までを振り返る--Unicodeコンソーシアムの影響力 前回はどこまでお話ししましたっけ。世界中の文字の収録を目的とした文字コード規格、Unicodeは、米国のIT企業を中心に結成されたUnicodeコンソーシアムが制定するデファクト規格に過ぎないこと。しかし公的な国際機関が定めるデジュール規格ISO/IEC 10646と同期することで、WTO/TBT協定にもとづき世界中の国々に普及させられるメリットを得たこと。 また、Unicodeコンソーシアム自体はオープンな組織だけれど、意志決定を行うUTC(Unicode Technical Committee/Unicode技術委員会)で一票を投じる権利を持つのは一握りの団体に限られること。そしてUTCはISO/IEC 10646のアメリカ・ナショナルボディであるL2委員会と合同でしか開催されておらず、同時にL2委員会とUnicodeコンソー
じつはコメントを送っていたNTTドコモ 最初に前回のおさらいをしておきましょう。スタート当初の携帯電話の絵文字には、キャリア間でメールのやり取りの中で文字化けしてしまう欠点があったこと、それを解決する仕組みをキャリア各社が作ったものの、その場しのぎの欠点の多いものであったこと、そして絵文字のUnicode符号化というのはそうした欠点を一挙に解決するはずであること。ついでにGoogleが絵文字のUnicode符号化を進めることで、キャリア各社は今まで自分たちが育ててきた絵文字の主導権を奪われてしまうということも。 それから前回の最後では、キャリア各社に対してGoogleの提案についてどう思うか、パブリックレビューに参加する意向があるかを聞いてみました。そこでの回答は、各社そろって消極的と受け取れるものでした。 ところが前回の掲載後に、NTTドコモがGoogleの絵文字メーリングリストに投稿し
Unicodeが携帯電話の絵文字を収録へ 絵文字ってなに?そう聞かれても多くの人は、ああ、それはと答えられるはず。そう言えばちょっと前に『メールのハートマークにだまされるな! 8割の女性は「恋人以外にも使う」』(RBB NAVI)なんていうニュースもありました。携帯電話の個人普及率が9割を上回る(平成20年内閣府消費動向調査)この国において、絵文字はごくありふれたものになっている現実があります。 2008年の11月27日、Googleが携帯電話で使われる絵文字を国際的な文字コード規格、Unicodeに収録しようというプロジェクト進行中であることを発表しました。では、このニュースは何を意味するのでしょう。そして私たちに何をもたらすのでしょう。今回から3回に分けて考えてみようと思います。 まず歴史を振り返ってみましょう。じつは絵文字を使ったのは携帯電話が最初というわけでありません。先行するもの
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く