『InDesignにおける「GSUBフィーチャ文字化け」の解明』 http://www.pubridge.jp/info/20121005t/ の著者のみなさんによる紹介ツイートです。
この項10月5日追記。OS X v10.8.2追加アップデート1.0により、次項以下で言及している本文の文字化けは解消された(ローマ数字の「Ⅴ」が「㈸」に化けるのは仕様なので従来どおり)。アップデート後に受信したメッセージについては、本文・件名ともに化けない。ただし、受信済みのメッセージについては、アップデート後に本文の文字化けは直ったが、件名の文字化けは直らなかった(下図)*1。 OS X 10.8.2のMail.appでは、Windows外字入りのISO-2022-JPを受信すると、メッセージ全体が化けることがある*2。たぶん、下図ピンク地の文字が1つでも含まれていると、メッセージ全体が(まるでソースを表示しているように)化ける。 下図は、Thunderbirdから本文に「ローマ数字のⅤ」「ローマ数字のⅥ」と書いたメールを送信し、OS X 10.8.2のMail.appで受信・表示した
下図は、SoftBank iPhoneのMailが用いるShift_JISのIBM拡張文字領域*1。どうだ、驚いたろう。 SoftBank iPhoneのMailは、charset=Shift_JISをよく使う。髙村薫の「髙」や宮﨑あおいの「﨑」などのWindows外字もShift_JISで送るし、絵文字もShift_JISで送る。しかし、WindowsのIBM拡張文字領域とSoftBankの絵文字領域は、もともと衝突しており、共存できない。なので、SoftBank iPhoneのShift_JISでは、IBM拡張文字のうち下図ピンク部分が使えない。 だったらその分は、NEC選定IBM拡張文字のほうを使えばいいじゃないですか、どうせダブってるんだから(下図)。というのが、大ざっぱに言えば、SoftBank iPhoneのMailが用いるShift_JISである。 その外字領域をまとめると、
日本発の文化「emoji」(絵文字)が米国でも浸透し始めていると、このほどNew York Timesが報じた。AppleがiOS 5の英語版でも絵文字キーボードを使えるようにしたためで、メールなどで「ちょっとした気持ち」を加えて伝えることができるとして米国ユーザーが使い始めているという。 iOS 5英語版では、設定によって絵文字用のキーボードが選択できるようになった。記事では友達とのやり取りに絵文字を使う学生や、9歳の子どもと絵文字入りメールでコミュニケーションしている39歳の法律家の男性を紹介。「会話で使われる身振り手振りのようなものだ」という米国のメディア研究者の見方を紹介している。 またこの研究者は、Appleが英語版で絵文字キーボードを使えるようにしたのは、iPhoneならではのモバイル文化を作りたいAppleのビジネス戦略に基づくものではないか、という。 ただ、絵文字は日本で生
独立行政法人情報処理推進機構(IPA)は、文字情報基盤 文字情報一覧表(MJ文字情報一覧表) をクリエイティブ・コモンズ 表示 – 継承 2.1 日本 ライセンスによって提供しています。利用に際してはIPA の著作物であることを明記してください。なお、本成果物の内容を適用した結果生じたこと、また、適用できなかった結果について、IPAは一切の責任を負いませんのでご了承ください。 MJ文字情報一覧表 変体仮名編 項目一覧 リリースノート MJ文字情報一覧表Ver.005.02 MJ文字情報一覧表のダウンロード(xml形式、xlsx形式、ods形式) MJ文字情報一覧表のファイル(画像なし)は下記からダウンロードできます。xlsx形式とods形式いずれも同じ内容です。 xml形式 mji.00502.zip(2.5MByte) xlsx、ods形式 mji.00502-xlsx.zip(5.5M
▲夏休みに限らず、朝はプリンタの上で寝る習慣がついてしまった… 先週紹介した書籍には興味を持っていただけただろうか。筆者はこの1週間で2冊の本を読んだので紹介しよう。 ●夏休みの終わり お盆なので、そろそろ夏休み特集も終わろうかと思ったが、もう1回だけ続けようと思う。理由は2つある。1つは、先週紹介した書籍を読み終えたので紹介したいと思ったこと。もう1つは夏休みの終わりはお盆(盂蘭盆会)ではなく、地蔵盆だという印象が強いからだ。地蔵盆というのは、京都を中心に大阪や滋賀などで行われる子ども向けの行事で、毎年8月23日ごろに開催される。 筆者の先輩社員は「日曜日の午後5時半に『笑点』を見ると週末の終わりを実感する」と言っていたが、少々早いように思う。やはり週末の終わりは6時半からの『サザエさん』であろう。そして、夏休みの終わりはお盆よりも地蔵盆である。 今回紹介するのは2冊。1冊は先週紹介し
ちょっと久々のJavaネタですが、 前から書き溜めていた、文字コードやエンコードについてのノウハウを書きます。 今回は、詳細な説明に入る前に、前提になる知識や用語について説明しておきます。 文字コードとエンコードって違うの? 新人くん「では、HTMLの文字コードはUTF-8でお願いします」 先輩社員「文字コードじゃなくてエンコーディングでしょ?」 新人くん「えっ。あぁ、はい、それで」 文字コードとエンコード(エンコーディング)を混同して使ったりすると、 ちょっと原理主義的な人に怒られたりするんですけど、 大まかに言えば、「文字コード」は文字に割り当てられた「数字」のことで、 「エンコード」は文字と数字をマッピングする「方式」のことだと捉えていれば、大きくは外れません。 ただ、「文字コード」という言葉は、「数字」「方式」の両方で使われるほか、 文字一覧を示す「Charset」という意味で使わ
・「美乳」で文字化けが直るって本当? オンラインDVD&CDレンタルなら月々1980円で借り放題のDMMがお得! えっ? って聞きなおしたくなるようなタイトルですが、「この『美乳』という文字をヘッダー部分にコメントとして挿入しておくと、文字化けが直る」という話は確かに存在します。ただし、これは大前提としてEUC-JPのページを作成するならば、という話になります。 <HTML> <HEAD> <meta http-equiv=Content-Type content="text/html; charset=EUC-JP"> <!-- 美乳 --> <TITLE>テスト1</TITLE> </HEAD> <BODY bgcolor="#FFFFFF"> このページはアダルトサイトとは無縁です。ヌード画像などは一切ありません。 </BODY> </HTML> では、なぜ、この「美乳」がおまじない
JEPAによる「出版物のUnicode化推進セミナー」をきっかけに、IVSについて熱く語り合った記録。思いがけず沢山の人が呼応してくれたので、まとめておきます。 IVSについては「UTS #37 UNICODE IDEOGRAPHIC VARIATION DATABASE」(http://unicode.org/reports/tr37/)、安岡孝一「漢字1文字が最大8バイト、Unicodeの「IVS」とは?」(http://itpro.nikkeibp.co.jp/article/COLUMN/20100126/343783/)、拙稿「包摂された字体を区別できる異体字シーケンス」(http://internet.watch.impress.co.jp/cda/jouyou/2008/09/09/20793.html)あたりをご参照ください。
@thotonさんの漢字廃止論に対する議論をまとめたものです。 前提として@thotonさんは「ひらがな文字を主軸とした新しい言語の使用」を前提としているものであって、今使われている日本語から漢字とカタカナを廃止するだけ……という訳ではないようです。 (ちなみにカタカナの廃止も含まれているようです) 続きを読む
「馬へんに匃」(大漢和番号44666)がデータ処理上、必要となったのだが、この字がISO/IEC 10646規格票のどこにもない。そんなはずはないだろう、とUnicodeをチェックしてみたら、U+2989Bにある。じゃあ、ISO/IEC 10646のU+2989Bはどうかと言うと、中が「人」ではなく「㐅」になっている。 こういうワケのわからないことになってしまっているのは、康煕字典が「馬へんに匃」の中の「人」を、あやまって「㐅」に作ってしまったからだ。実際、JTC1/SC2/WG2/N3593では、2989Bのところに、これら2字が併記される形となっている。でも、この2字をUCSで統合するのは、そもそもちょっと無理があったんじゃないだろうか…。
すべての Microsoft 製品 Global Microsoft 365 Teams Copilot Windows Surface Xbox セール 法人向け サポート ソフトウェア Windows アプリ AI OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入する アクセサリ VR & 複合現実 エンタメ Xbox Game Pass Ultimate Xbox Live Gold Xbox とゲーム PC ゲーム Windows ゲーム 映画とテレビ番組 法人向け Microsoft Cloud Microsoft Security Azure Dynamics 365 一般法人向け Microsoft 365 Microsoft Industry Microsoft Power Platform W
PRI 167のIVD登録が完了したという連絡をいただいた 。ざっとチェックしてみたところ、Adobe-Japan1と住民基本台帳ネットワーク統一文字とで全く別々のIVSを付与する、という、かなりシビレル結果となっている。たとえば以前書いた「邊」に関しては、こんな感じ。 住基908A(U+908A U+E0108) CID+6929(U+908A U+E0100) 住基BD45(U+908A U+E0109) CID+14236(U+908A U+E0102) 住基BD5E(U+908A U+E010E) 住基BD5F(U+908A U+E010D) 住基BD60(U+908A U+E010C) 住基BD61(U+908A U+E010B) CID+20234(U+908A U+E0107) 住基BD62(U+908A U+E010A) 住基BD6A(U+908A U+E0110) CID
【お願い】使用言語登録のお願い(お知らせ) グリフウィキにようこそ! グリフウィキ(GlyphWiki)は、明朝体の漢字グリフ(漢字字形)を登録・管理し、皆で自由に共有することを目的としたウィキです。 一般的にフォントや個々の漢字グリフの管理は面倒ですが、グリフウィキでは簡単に漢字グリフをデザインすることができ、さらにウィキですので漢字グリフ1つ1つを独立して管理できます。また、グリフを集めてフォントを作り、即座に公開することができます。 グリフの管理は誰でも可能です。また、登録されているグリフは自由に使うことができます。自分が必要なグリフを必要なだけ登録し、既に登録されているデータの一部と合わせ、まとめてフォントにすることができます。現在1,000,000を超える量の漢字グリフが登録されています(別名同字形グリフを別カウントの場合)。 あなたの持っている外字データ・異体字データをグリフウ
新しいIVDをチェックしていたのだが、やはり、かなりヤヤコシイ点があるようだ。たとえば、戸籍統一文字の「降」。 戸籍統一文字の「降」には、472040と472620と472650がある。一方、新しいIVDの「降」ガラミは以下のとおり。 964D E0100; Adobe-Japan1; CID+2033 964D E0101; Adobe-Japan1; CID+13447 964D E0102; Hanyo-Denshi; JA2563 964D E0103; Hanyo-Denshi; KS472040 472620を「U+964D U+E0102」、472040を「U+964D U+E0103」で表すのはいいとして、では472650を「U+964D U+E0101」で表すのは正しいのか間違いなのか。それとも近い将来において、472650がたとえば「U+964D U+E0104」に追加
思うところあって、住民基本台帳ネットワーク統一文字の「邉」と「邊」に対して、現時点でのIVDがどう対応しているか、チェックしてみた。 9089 (U+9089 U+E0100) BD27 (U+9089 U+E0105) BD29 BD2A (U+9089 U+E0102) BD2B BD2C (U+9089 U+E010A) BD2D BD38 BD47 BD49 (U+9089 U+E0109) BD4A BD4B BD4C (U+9089 U+E010E) BD4E BD4F BD50 BD64 (U+9089 U+E0103) BD65 BD69 BD73 908A (U+908A U+E0100) BD45 (U+908A U+E0102) BD46 BD51 BD5E BD5F BD60 BD61 (U+908A U+E0107) BD62 BD63 BD6A (U+908A
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く