タグ

文字コードに関するardarimのブックマーク (265)

  • ぼくの大好きな符号化文字 - もじのなまえ

    ときどき私的な席で「どんな仕事をしてるんです?」と聞かれます。「フリーライターです」と答えるとたいていは納得してくれますが、なかには「で、どんなものを書いてるんです?」と突っ込んでくる人もおられる。 すると、はたと考え込んでしまいます。もちろん自分がどんなことを書いているかは分かっている。同時に、それがすごく面白いと思っているから原稿に書いているわけです。でも、その面白さを専門外の人にも分かりやすく説明するって、案外むずかしいものです。もっとも、それをすることは自分の足下を見つめ直すことになるのかもしれません。 1989年の印刷文字 ぼくの専門は符号化文字です。文字コードとかフォントとか、符号化文字に関わる全般。このブログでこのところ集中的に取り上げている常用漢字表の改定も、そうした視点から見ています。では、その符号化文字とはなにか? もう20年以上も前、1989年だったと思います。手塚治

    ぼくの大好きな符号化文字 - もじのなまえ
    ardarim
    ardarim 2010/01/12
    良まとめ。惜しむらくは「文字コード」でなく「符号化方式」の方がよかったか。専門用語を使わないという軛であえてこうしたのかな… 「専門外の人にも分かりやすく説明するって、案外むずかしい」あるある!
  • 文化庁ホームページの文字コード | yasuokaの日記 | スラド

    今日が「改定常用漢字表試案への意見」の〆切なので、景気づけに文化庁ホームページの「サイト内検索(e-Gov)」で、問題の4字を検索してみることにした。 「𠮟」検索不能 「塡」検索不能 「剝」検索不能 「頰」検索不能 …っていうか、このホームページ、そもそも文字コードがShift_JISなんだけど。その上、HIDDENパラメータの中に「JCODE=SJIS」ってのがあって、e-GovにはシフトJISしか渡せなくなってる。 仕方がないので、【改定常用漢字表試案への意見】テンプレートで最初に示した4字を、代わりに検索してみた。 「叱」31件ヒット 「填」65件ヒット 「剥」316件ヒット 「頬」6件ヒット ふーん。表外漢字字体表を9年前に答申して、5年10ヶ月前にはJIS X 0213まで改正させたのに、文化庁内部ですらまだこんな状態なのね。まあ、常用漢字表が改定されたら、e-Govの作り直し

    ardarim
    ardarim 2010/01/07
    まあ縦割り行政なんてそんなものでしょう…
  • Supplementary PlaneとVariation Selector | yasuokaの日記 | スラド

    slashdot.jpでISO/IEC 10646のSupplementary Planeが使えるようになったので、「𠮟」や「𠮷」が「𠮟」「𠮷」で書けるようになった。まずはうれしい。中の人たち、ありがとうございます。ただ、「󠄁」には対応していないらしく、たとえば「葛」(葛󠄀)と「葛」(葛󠄁)は書き分けられないようだ。まあ、花園明朝と小塚Pr6Nくらいしか対応フォントがないから、もうしばらくは問題にならないと思うけど。

  • 4バイトのUTF-8と検索サイト | yasuokaの日記 | スラド

    小川さんのとこにコメントしながら、新常用漢字表に検索サイトがどの程度対応しているのか、ちょっと調べてみた。 「𠮟」: biglobe bing excite goo google infoseek yahoo 「塡」: biglobe bing excite goo google infoseek yahoo 「剝」: biglobe bing excite goo google infoseek yahoo 「頰」: biglobe bing excite goo google infoseek yahoo これを見た限りでは、gooは中がEUC-JP、exciteは中がShift_JISらしく、UTF-8サポートとは言いがたい。その他のサイトは、3バイトのUTF-8は検索できたが、4バイトのUTF-8を検索できたのは唯一googleだけだった。うーむ、新常用漢字表をサポートできる検索

  • 「シフトJIS」では対応不可能な新常用漢字表 | yasuokaの日記 | スラド

    今日発売された『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』(日経コンピュータ, No.745 (2009年12月9日), pp.89-93)の読者から、早速、文化審議会国語分科会に陳情したいのだがどうしたらいいのか、という質問が複数あった。文中の どうしても「𠮟」がサポートできそうにないなら、その旨を文化審議会国語分科会に陳情する、という手も残されている。新しい常用漢字表は改正案の段階であり、2009年12月24日までは一般からのコメント(パブリックコメント)を受け付けているからだ。「𠮟」ではなく「叱」を常用漢字にしてほしい、あるいは、「𠮟」の「許容字体」として「叱」を認めてほしい、と陳情するのだ。 に呼応したものだ。とりあえず、パブリックコメントのページをお教えしたが、うーむ、文中にURLかメールアドレス(kanzihyo@bunka.go.jp)く

    ardarim
    ardarim 2009/12/22
    陳情しようにもそもそもシフトJISで書けないのか… こういうところに既に問題が潜んでいることを理解してるのかな
  • どうして常用漢字表を改定するハメになったのか | yasuokaの日記 | スラド

    『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』(日経コンピュータ, No.745 (2009年12月9日), pp.89-93)の読者から、「そもそもどうして常用漢字表を改定しなきゃいけないんですか」と質問された。それはもちろん、平成17年3月30日に文部科学大臣から諮問第15号「情報化時代に対応する漢字政策の在り方について」が文化審議会に対して…、と答えかけて、私(安岡孝一)自身、途中で答につまってしまった。だって、文部科学大臣の諮問は、以下のようなものだったはずだ。 種々の社会変化の中でも,情報化の進展に伴う,パソコンや携帯電話などの情報機器の普及は人々の言語生活とりわけ,その漢字使用に大きな影響を与えている。このような状況にあって「法令,公用文書,新聞,雑誌,放送など,一般の社会生活において,現代の国語を書き表す場合の漢字使用の目安」である常用漢字表(昭和5

    ardarim
    ardarim 2009/12/22
    先に改定ありきで、なんとか作文したのかなあ。多分。
  • ワープロの絵文字 | yasuokaの日記 | スラド

    SHARP書院WD-A521のマニュアル「WD-A521/A541/A551 日語ワードプロセッサ取扱説明書(文書編)」を読んでいたところ、文字コードの記号一覧のところに、絵文字が160種類ほど収録されているのを見つけた。絵文字の中にマル金とマルビが含まれていることから、あるいは1984年頃にデザインされた可能性が考えられるが、WD-A521それ自体は1990年11月の発売だ。だとすると、これより古い書院にも、絵文字が搭載されているのかもしれない。 ただ、ワープロのマニュアルは、どこの図書館を探しても所蔵がない。SHARPも、既に当時のマニュアルは破棄してしまっており、全く在庫がないようだ。だとすると、個人蔵のマニュアルを探すことになるのだけど、全く雲をつかむような話で…。この日記を読んだ方で、手元に古いワープロ(書院に限らない)のマニュアルをお持ちの方は、ぜひ文字コードのページを調べて

    ardarim
    ardarim 2009/12/21
    素朴な疑問としてスキャンして第三者に譲渡…って著作権的に大丈夫なんだろうか…/実家に書院のマニュアルが完全な状態で残っててびびった。WD-750なのでコード表は全く同じ。
  • 第4回ワークショップ:文字―言語生活のなかの文字―/第1回研究会

    Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode

  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
  • 勉誠出版 --論集 文字 新常用漢字を問う

    place株式会社勉誠社 〒101-0061 東京都千代田区神田三崎町2-18-4 徳栄ビル4F 適格請求書発行事業者登録番号 T9020001139496

  • 「「絵文字の議論は、これでいいのだろうか。」へのお答え」へのコメント - Cafe Babe

    小形克宏氏は,残念ながら山太郎氏が「絵文字の議論は、これでいいのだろうか。」で言いたかった真意を誤解しているように見える. 「絵文字の議論は、これでいいのだろうか。」へのお答え(もじのなまえ) 山氏の指摘にもあるように,実は小形氏の発言の「攻撃的な」姿勢と事実と異なる推測は,すでにいろいろなところで問題にされている.例えば,GoogleやUnicodeコンソーシアムは,当に「世界征服を目論む陰謀組織」なのだろうか?(笑) この原因は,小形氏が今回の事情を勘違いしていることにあると思っている.いつかは直接の関係者から真実が知らされると思っていたし,今まで得られた情報を分析すれば容易に気が付くだろうとも思っていたが,さしつかえないと思う程度まで事情を書くことにする. 今回の提案の大元は,Gmailの携帯絵文字対応である.これは,日のキャリアや日の携帯ユーザからの要望を受けて,Goog

    「「絵文字の議論は、これでいいのだろうか。」へのお答え」へのコメント - Cafe Babe
  • 絵文字の修正提案をめぐる、ひとまずの総括 - もじのなまえ

    ここ数回、ISO/IEC 10646の追補8(Amd8)として審議中だった絵文字に対し、ぼくもふくめた5人が提出した修正案(N3711)にについてご報告してきました。 正確にはまだ最終決着とは言えない段階なのですが、ひとまずここまでの総括をしたいと思います。 WG2東京会議の審議結果について われわれの文書については、絵文字を一括して審議した分科会「Emoji Ad-Hoc meeting」で取り上げられ、その結果は「Emoji Ad-Hoc Meeting Report」の第17条(p.4)に明記されました。 17. In reference to documents N3711, N3713: The Ad-hoc agreed on a basic goal that names and glyphs for Emoji symbols in the UCS should refle

    絵文字の修正提案をめぐる、ひとまずの総括 - もじのなまえ
  • 「PDAM8におけるEmoticonに対する修正提案」対訳版 - もじのなまえ

    10月22日のエントリ「自分の持ち場を守ること」に、たくさんのブックマーク、はてなスターをありがとうございました。とても勇気づけられました。明日から東京会議が始まるわけですが、おそらく日程の前半でEmoji Ad hoc meeting(絵文字分科会)が開催され、そこで提案趣旨を述べることになろうかと思います。 そこで、説明のためのアンチョコとして作成した提案書の対訳版を公開します。 ここに掲載するのは、第1節「Preface(前文)」と第2節「Details of the Proposal(提案の詳細)」だけです。第3節は表ですので、これは原文をご参照ください。また、第2節を読むに当たっても、原文第3節の表を参照しながらの方が分かりやすいと思います。 - 1. Preface(前文) 1.1 Reason of This Proposal(提案する理由) We welcome the p

    「PDAM8におけるEmoticonに対する修正提案」対訳版 - もじのなまえ
    ardarim
    ardarim 2009/10/28
    引用元はどうやって選んだんだろうww
  • 1億人を代表して、皆さんにお願いします。 - もじのなまえ

    日はWG 2東京会議の2日目、午前11時から昼をはさんで午後4時まで、Emoji Ad-Hoc会議が開催され、その場でぼくたちが提出した「A Proposal to Revise a Part of Emoticons in PDAM 8」(N3711)が審議されました。 その冒頭で、趣旨説明をしたわけですが、その草稿を公開します。これは開会直後に趣旨説明が必要であることが分かり、会議の最中に即席で書いたものです。内容的にはN3711のサマリーになっています。 来なら英語でスピーチするところですが、ぼくにはとても無理。そこで日ナショナルボディのご好意により、関口委員長自ら通訳してくださいました。まだるっこしい日語の話を辛抱強く聞いてくださった各国ナショナルボディの諸氏にも深く感謝。 私達は日の携帯電話ユーザーとして、UCSが絵文字を収録することを支持します。 それは日での絵文

    1億人を代表して、皆さんにお願いします。 - もじのなまえ
  • 第9回 文字コードが引き起こす表示上の問題点[前編] | gihyo.jp

    文字コードが引き起こす問題点は、これまで説明したような比較の一致・不一致といったソフトウェアの処理上のものだけでなく、人間に対する視覚的な効果という点でも強く影響を与え、攻撃者にとっての強力な道具となることがあります。 今回および次回で、そのような文字コードが引き起こす視覚的な問題点を紹介します。 視覚的に似た文字 見かけのよく似た文字は、フィッシングなどによく利用されます。典型的な例としては、アルファベット小文字のl(エル)と数字の1などがあります。たとえば、http://bank1.example.jp/ というURLのオンラインバンクがあったとすると、攻撃者は http://bankl.example.jp/ というURLを使ってフィッシングを企むということは容易に想像できると思います。 もちろん、収録している文字数が増えれば増えるだけ、このように見かけのよく似た文字が存在する率も高

    第9回 文字コードが引き起こす表示上の問題点[前編] | gihyo.jp
  • 自分の持ち場を守ること - もじのなまえ

    どうもご無沙汰をしております。前回エントリから1ヵ月以上ですか。この間、「もじもじカフェ」があったり(たくさんの方に足を運んでいただき、ありがとうございました)、明日にはいよいよ漢字小委員会で最終答申案が発表される予定だったりと、けっして書くネタに困るような状況ではなかったのですが、ここ1ヵ月はブログどころではなかったのが実情でした。 では、なにをやっていたかというと、仲間とともに以下のような文書を作っておりました。 A Proposal to Revise a Part of Emoticons in PDAM 8[「PDAM8におけるEmoticonに対する修正提案」PDF/1.1MB] ISO/IEC 10646を審議するWG2委員会への寄書。絵文字についてです。 昨年11月にGoogle絵文字をUnicodeに収録する計画を発表しました。これは順調にすすみ、今年2月にUnicod

    自分の持ち場を守ること - もじのなまえ
  • CNS11643 中文全字庫(舊版)-首頁

    2018-05-10 「107年中文全字庫網站推廣應用說明會」5月14日10:00開放報名囉! 2018-04-03 新增暫編戶政姓名用字14-3E5D及17-2141,共2字 2018-01-31 新增暫編戶政姓名用字17-213F,共1字 2018-01-23 新增暫編戶政姓名用字17-213D及17-213E,共2字 2017-11-02 新增暫編戶政姓名用字12-5023,共1字

    ardarim
    ardarim 2009/10/17
    こんなわかりやすい公式まとめがあるとは知らなかったわ
  • Unicode Terminology: English - Japanese

    Unicode Terminology English - Japanese This terminology page, which includes both Unicode terms and ISO/IEC 10646 terms, is sorted by English, giving the corresponding Japanese translation of each term. There is also a Japanese - English page.

  • htmlspecialcharsに関する残念なお知らせ - 岩本隆史の日記帳(アーカイブ)

    htmlspecialcharsのパッチ私案」に書いた件、バグレポートを出してみましたが、「すでに同じバグレポートがあるだろ」という理由により、あえなく却下されました。 せめて先方が「同じ」とみなしているレポート番号ぐらいは示してほしくて、そのようにコメントしましたが、お相手のjaniという人は気難し屋のようで*1、教えてもらえる気がしません。 私なりに探した結果、下記のレポートがくさいように感じました。 PHP :: Bug #43896 :: htmlspecialchars() returns empty string on invalid unicode sequence 「不正なUTF-8シーケンスの場合に空文字列を返すのはおかしい」というレポートで、私のそれとは正反対どころか、Shift_JISにもEUC-JPにも触れられていない別個のものです。もちろん、私はレポート送信前に

    htmlspecialcharsに関する残念なお知らせ - 岩本隆史の日記帳(アーカイブ)
  • Announcing the “CMap Resources” open source project

    CJK Type Blog CJK Fonts, Character Sets & Encodings. All CJK. #AllOfTheTime. Chinese Thanks to requests from numerous open source developers over the years, along with Adobe’s own “Open Source Initiative,” all of Adobe’s CMap resources are now available under an open source license. See: http://opensource.adobe.com/wiki/display/cmap/ The “CMap Resources” open source project includes all CMap resou