タグ

文字コードに関するardarimのブックマーク (265)

  • OS X 10.8.2のMail.appで新種の文字化け - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    この項10月5日追記。OS X v10.8.2追加アップデート1.0により、次項以下で言及している文の文字化けは解消された(ローマ数字の「Ⅴ」が「㈸」に化けるのは仕様なので従来どおり)。アップデート後に受信したメッセージについては、文・件名ともに化けない。ただし、受信済みのメッセージについては、アップデート後に文の文字化けは直ったが、件名の文字化けは直らなかった(下図)*1。 OS X 10.8.2のMail.appでは、Windows外字入りのISO-2022-JPを受信すると、メッセージ全体が化けることがある*2。たぶん、下図ピンク地の文字が1つでも含まれていると、メッセージ全体が(まるでソースを表示しているように)化ける。 下図は、Thunderbirdから文に「ローマ数字のⅤ」「ローマ数字のⅥ」と書いたメールを送信し、OS X 10.8.2のMail.appで受信・表示した

    OS X 10.8.2のMail.appで新種の文字化け - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • SoftBank iPhoneのShift_JISがすごいことになっている件 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    下図は、SoftBank iPhoneのMailが用いるShift_JISのIBM拡張文字領域*1。どうだ、驚いたろう。 SoftBank iPhoneのMailは、charset=Shift_JISをよく使う。髙村薫の「髙」や宮﨑あおいの「﨑」などのWindows外字もShift_JISで送るし、絵文字もShift_JISで送る。しかし、WindowsのIBM拡張文字領域とSoftBankの絵文字領域は、もともと衝突しており、共存できない。なので、SoftBank iPhoneのShift_JISでは、IBM拡張文字のうち下図ピンク部分が使えない。 だったらその分は、NEC選定IBM拡張文字のほうを使えばいいじゃないですか、どうせダブってるんだから(下図)。というのが、大ざっぱに言えば、SoftBank iPhoneのMailが用いるShift_JISである。 その外字領域をまとめると、

    SoftBank iPhoneのShift_JISがすごいことになっている件 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    ardarim
    ardarim 2012/04/24
    一昔、二昔くらい前の実装だったらまあ仕方ないかなあという気がするけど、イマドキの実装でこれは無いわ…。
  • Unicode BMP Fallback Font

  • 「絵文字」文化が米国でも広がる iPhone普及で

    発の文化emoji」(絵文字)が米国でも浸透し始めているという。iOS 5で英語版でも絵文字キーボードを使えるようになったためだ。 日発の文化emoji」(絵文字)が米国でも浸透し始めていると、このほどNew York Timesが報じた。AppleがiOS 5の英語版でも絵文字キーボードを使えるようにしたためで、メールなどで「ちょっとした気持ち」を加えて伝えることができるとして米国ユーザーが使い始めているという。 iOS 5英語版では、設定によって絵文字用のキーボードが選択できるようになった。記事では友達とのやり取りに絵文字を使う学生や、9歳の子どもと絵文字入りメールでコミュニケーションしている39歳の法律家の男性を紹介。「会話で使われる身振り手振りのようなものだ」という米国のメディア研究者の見方を紹介している。 またこの研究者は、Apple英語版で絵文字キーボードを使えるよ

    「絵文字」文化が米国でも広がる iPhone普及で
  • MJ文字情報一覧表 | 文字情報基盤整備事業

    独立行政法人情報処理推進機構(IPA)は、文字情報基盤 文字情報一覧表(MJ文字情報一覧表) をクリエイティブ・コモンズ 表示 – 継承 2.1 日 ライセンスによって提供しています。利用に際してはIPA の著作物であることを明記してください。なお、成果物の内容を適用した結果生じたこと、また、適用できなかった結果について、IPAは一切の責任を負いませんのでご了承ください。 MJ文字情報一覧表 変体仮名編 項目一覧 リリースノート MJ文字情報一覧表Ver.005.02 MJ文字情報一覧表のダウンロード(xml形式、xlsx形式、ods形式) MJ文字情報一覧表のファイル(画像なし)は下記からダウンロードできます。xlsx形式とods形式いずれも同じ内容です。 xml形式 mji.00502.zip(2.5MByte) xlsx、ods形式 mji.00502-xlsx.zip(5.5M

    ardarim
    ardarim 2011/11/01
    ここまで総括的にまとまってるのってなかなかないからこれは便利だわ。
  • 夏休み読書感想文:「ユニコード戦記」と「巨象も踊る」 - Computerworld

    ▲夏休みに限らず、朝はプリンタの上で寝る習慣がついてしまった… 先週紹介した書籍には興味を持っていただけただろうか。筆者はこの1週間で2冊のを読んだので紹介しよう。 ●夏休みの終わり お盆なので、そろそろ夏休み特集も終わろうかと思ったが、もう1回だけ続けようと思う。理由は2つある。1つは、先週紹介した書籍を読み終えたので紹介したいと思ったこと。もう1つは夏休みの終わりはお盆(盂蘭盆会)ではなく、地蔵盆だという印象が強いからだ。地蔵盆というのは、京都を中心に大阪や滋賀などで行われる子ども向けの行事で、毎年8月23日ごろに開催される。 筆者の先輩社員は「日曜日の午後5時半に『笑点』を見ると週末の終わりを実感する」と言っていたが、少々早いように思う。やはり週末の終わりは6時半からの『サザエさん』であろう。そして、夏休みの終わりはお盆よりも地蔵盆である。 今回紹介するのは2冊。1冊は先週紹介し

    ardarim
    ardarim 2011/08/26
    「ユニコード戦記」良さそうだな…
  • いいから聞け! 俺が文字コードについて教えてやるよ その1(前提知識編) - 谷本 心 in せろ部屋

    ちょっと久々のJavaネタですが、 前から書き溜めていた、文字コードやエンコードについてのノウハウを書きます。 今回は、詳細な説明に入る前に、前提になる知識や用語について説明しておきます。 文字コードとエンコードって違うの? 新人くん「では、HTMLの文字コードはUTF-8でお願いします」 先輩社員「文字コードじゃなくてエンコーディングでしょ?」 新人くん「えっ。あぁ、はい、それで」 文字コードとエンコード(エンコーディング)を混同して使ったりすると、 ちょっと原理主義的な人に怒られたりするんですけど、 大まかに言えば、「文字コード」は文字に割り当てられた「数字」のことで、 「エンコード」は文字と数字をマッピングする「方式」のことだと捉えていれば、大きくは外れません。 ただ、「文字コード」という言葉は、「数字」「方式」の両方で使われるほか、 文字一覧を示す「Charset」という意味で使わ

    いいから聞け! 俺が文字コードについて教えてやるよ その1(前提知識編) - 谷本 心 in せろ部屋
    ardarim
    ardarim 2011/06/16
    今更だけどなかなかよいまとめかな。初心者向け。とはいえリンクで済ませず本文で解説すれば?とは思う。
  • 「美乳」で文字化けが直るって本当?

    ・「美乳」で文字化けが直るって当? オンラインDVD&CDレンタルなら月々1980円で借り放題のDMMがお得! えっ? って聞きなおしたくなるようなタイトルですが、「この『美乳』という文字をヘッダー部分にコメントとして挿入しておくと、文字化けが直る」という話は確かに存在します。ただし、これは大前提としてEUC-JPのページを作成するならば、という話になります。 <HTML> <HEAD> <meta http-equiv=Content-Type content="text/html; charset=EUC-JP"> <!-- 美乳 --> <TITLE>テスト1</TITLE> </HEAD> <BODY bgcolor="#FFFFFF"> このページはアダルトサイトとは無縁です。ヌード画像などは一切ありません。 </BODY> </HTML> では、なぜ、この「美乳」がおまじない

  • 50年に1度!? IVSをめぐる熱いw討論

    JEPAによる「出版物のUnicode化推進セミナー」をきっかけに、IVSについて熱く語り合った記録。思いがけず沢山の人が呼応してくれたので、まとめておきます。 IVSについては「UTS #37 UNICODE IDEOGRAPHIC VARIATION DATABASE」(http://unicode.org/reports/tr37/)、安岡孝一「漢字1文字が最大8バイト、Unicodeの「IVS」とは?」(http://itpro.nikkeibp.co.jp/article/COLUMN/20100126/343783/)、拙稿「包摂された字体を区別できる異体字シーケンス」(http://internet.watch.impress.co.jp/cda/jouyou/2008/09/09/20793.html)あたりをご参照ください。

    50年に1度!? IVSをめぐる熱いw討論
  • 漢字廃止論

    @thotonさんの漢字廃止論に対する議論をまとめたものです。 前提として@thotonさんは「ひらがな文字を主軸とした新しい言語の使用」を前提としているものであって、今使われている日語から漢字とカタカナを廃止するだけ……という訳ではないようです。 (ちなみにカタカナの廃止も含まれているようです) 続きを読む

    漢字廃止論
    ardarim
    ardarim 2011/01/31
    あまりのひどさにくらくらきて最後まで読めなかった。ナニコレ。
  • 「馬へんに匃」のUCS | yasuokaの日記 | スラド

    「馬へんに匃」(大漢和番号44666)がデータ処理上、必要となったのだが、この字がISO/IEC 10646規格票のどこにもない。そんなはずはないだろう、とUnicodeをチェックしてみたら、U+2989Bにある。じゃあ、ISO/IEC 10646のU+2989Bはどうかと言うと、中が「人」ではなく「㐅」になっている。 こういうワケのわからないことになってしまっているのは、康煕字典が「馬へんに匃」の中の「人」を、あやまって「㐅」に作ってしまったからだ。実際、JTC1/SC2/WG2/N3593では、2989Bのところに、これら2字が併記される形となっている。でも、この2字をUCSで統合するのは、そもそもちょっと無理があったんじゃないだろうか…。

    ardarim
    ardarim 2010/12/09
    なんでこうなっちゃったんだろ。http://www.kangxizidian.com/kangxi/1436.gif
  • マイクロソフト - PressPass ホーム - 製品画像ダウンロード

    すべての Microsoft 製品 Global Microsoft 365 Teams Copilot Windows Surface Xbox セール 法人向け サポート ソフトウェア Windows アプリ AI OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入する アクセサリ VR & 複合現実 エンタメ Xbox Game Pass Ultimate Xbox Live Gold Xbox とゲーム PC ゲーム Windows ゲーム 映画テレビ番組 法人向け Microsoft Cloud Microsoft Security Azure Dynamics 365 一般法人向け Microsoft 365 Microsoft Industry Microsoft Power Platform W

    ardarim
    ardarim 2010/12/08
    遅きに失した感も否めないが今後改善してくということなのか。国も巻き込んだほうがいいんじゃないの…?
  • PRI 167のIVD登録完了 | yasuokaの日記 | スラド

    PRI 167のIVD登録が完了したという連絡をいただいた 。ざっとチェックしてみたところ、Adobe-Japan1と住民基台帳ネットワーク統一文字とで全く別々のIVSを付与する、という、かなりシビレル結果となっている。たとえば以前書いた「邊」に関しては、こんな感じ。 住基908A(U+908A U+E0108) CID+6929(U+908A U+E0100) 住基BD45(U+908A U+E0109) CID+14236(U+908A U+E0102) 住基BD5E(U+908A U+E010E) 住基BD5F(U+908A U+E010D) 住基BD60(U+908A U+E010C) 住基BD61(U+908A U+E010B) CID+20234(U+908A U+E0107) 住基BD62(U+908A U+E010A) 住基BD6A(U+908A U+E0110) CID

    ardarim
    ardarim 2010/11/30
    今後も誰も調停する人がいないまま野放図に登録されて行っちゃうのだとしたらきついな…。
  • メインページ - GlyphWiki

    【お願い】使用言語登録のお願い(お知らせ) グリフウィキにようこそ! グリフウィキ(GlyphWiki)は、明朝体の漢字グリフ(漢字字形)を登録・管理し、皆で自由に共有することを目的としたウィキです。 一般的にフォントや個々の漢字グリフの管理は面倒ですが、グリフウィキでは簡単に漢字グリフをデザインすることができ、さらにウィキですので漢字グリフ1つ1つを独立して管理できます。また、グリフを集めてフォントを作り、即座に公開することができます。 グリフの管理は誰でも可能です。また、登録されているグリフは自由に使うことができます。自分が必要なグリフを必要なだけ登録し、既に登録されているデータの一部と合わせ、まとめてフォントにすることができます。現在1,000,000を超える量の漢字グリフが登録されています(別名同字形グリフを別カウントの場合)。 あなたの持っている外字データ・異体字データをグリフウ

    メインページ - GlyphWiki
    ardarim
    ardarim 2010/11/30
    こんなのがあったのか!
  • 戸籍統一文字の「降」とIVS | yasuokaの日記 | スラド

    新しいIVDをチェックしていたのだが、やはり、かなりヤヤコシイ点があるようだ。たとえば、戸籍統一文字の「降」。 戸籍統一文字の「降」には、472040と472620と472650がある。一方、新しいIVDの「降」ガラミは以下のとおり。 964D E0100; Adobe-Japan1; CID+2033 964D E0101; Adobe-Japan1; CID+13447 964D E0102; Hanyo-Denshi; JA2563 964D E0103; Hanyo-Denshi; KS472040 472620を「U+964D U+E0102」、472040を「U+964D U+E0103」で表すのはいいとして、では472650を「U+964D U+E0101」で表すのは正しいのか間違いなのか。それとも近い将来において、472650がたとえば「U+964D U+E0104」に追加

  • 「Unicode 6.0」が策定、絵文字が国際標準に 

    ardarim
    ardarim 2010/10/15
    そのうちベンダーごとのIVDとかが出されたりするんだろうか…
  • 住基コードの「邉」と「邊」 | yasuokaの日記 | スラド

    思うところあって、住民基台帳ネットワーク統一文字の「邉」と「邊」に対して、現時点でのIVDがどう対応しているか、チェックしてみた。 9089 (U+9089 U+E0100) BD27 (U+9089 U+E0105) BD29 BD2A (U+9089 U+E0102) BD2B BD2C (U+9089 U+E010A) BD2D BD38 BD47 BD49 (U+9089 U+E0109) BD4A BD4B BD4C (U+9089 U+E010E) BD4E BD4F BD50 BD64 (U+9089 U+E0103) BD65 BD69 BD73 908A (U+908A U+E0100) BD45 (U+908A U+E0102) BD46 BD51 BD5E BD5F BD60 BD61 (U+908A U+E0107) BD62 BD63 BD6A (U+908A

  • Microsoft Events

  • 文字情報基盤構築のフォント公募 | yasuokaの日記 | スラド

    経済産業省の『平成22年度電子経済産業省推進費(文字情報基盤構築に関する研究開発事業)に係る委託先の公募』に関して、この3週間というもの、あちこちから私(安岡孝一)のもとに質問があった。いいかげん、同じことばかり答えるのも飽きてきたので、今までに答えた内容を、ざっと、ここにまとめておくことにする。 事業は、(1)文字情報基盤の将来像や課題を整理するための調査研究と、(2)この調査研究を進める上での調査の素材となるフォントの整備の2つの内容により構成される。

    ardarim
    ardarim 2010/09/02
    公募案を作るようなお役人さんたちはここまでの見識は持ち合わせてないってだけなのかな。ないから作ろうみたいな単純な話だと思ってるのかもしれない。
  • GB 18030の 「&#x22489;」 | yasuokaの日記 | スラド

    山東省の一部の地域にある「シャン」という姓の漢字(文字の上部が彡、下部が且)は非常に珍しく、漢字コードが割り当てられていなかった。このため、運転免許証や銀行通帳に正しい姓名を印刷することができない。 このような煩わしさを解決するため、シャン一族は発音が同じ別の2種類の漢字を、姓として使うことにした。 それって、U+22489の「𢒉」なので、GB 18030だと[95 39 B7 39]にあると思うのだけど…。ちなみに、元ネタの中国新聞網のページでも、やはり「𢒉」がコンピュータで使えない文字として紹介されている。うーむ、GB 18030って山東省には普及してないのかしら?

    ardarim
    ardarim 2010/08/18
    地方政府だとGB18030なんて知らない古いシステム使ってたりするんじゃないかしらん。繁体の話だけどこういうネタとかに近いかも→http://tw.myblog.yahoo.com/kelly-cave/article?mid=11999&sc=1