ブックマーク / toyohira.asablo.jp (3)

  • Emacs 23でEUC-JIS-2004: 文字符号化blog

    少し前に、Emacs 23が正式にリリースされました。 まだよく触っていないのですが、Windowsマシンにダウンロードしてみました。 設定方法がよくわからないまま適当にぐぐって (set-default-font "IPAゴシック") としてみたら、EUC-JIS-2004のテキストがちゃんと表示されました。素晴らしい。 と思ったのもつかの間、Unicodeで結合文字の必要な25文字(鼻濁音用のかきくけことか)は正しく表示できていないことが判明。何が悪いのか分かりませんががっかりです。 これでは常用することはできません。多分どこか設定すれば正しく表示できるのだと思いますが、何をどうすればいいのか見当がつきません。 ああ、Unicodeがたった25文字くらいけちけちしなければこんなことで面倒な思いをせずにすんだのに、と思わずにいられないのですが、思ってもしようがないですね。

    mojiura
    mojiura 2009/09/09
    鼻濁音の仮名など 25 文字について「ああ、Unicodeがたった25文字くらいけちけちしなければ」とのこと。たしかにおっしゃるとおりで。まあ「けち」なことをしたわけでもないとは思いますが……。
  • 規格の読み方: 文字符号化blog

    前の記事を書くために久しぶりに97JISを読んだのですが、ああ、やっぱりこれは1997年の規格なんだなということを感じました。 というのは、規格が書かれた当時の常識や技術的な背景というもの (それらの多くは現在でも通じるにしても) が、規格の文言の裏に透けて見えるわけです。 規格というのは、文面に書かれたものが全てであるかのように読み、それできちんと意味が通じるのが良いわけです。というのは、異なるベンダの実装者が別々に読んで実装したものが、きちんと相互運用できてほしいから。けれどもその一方で、書かれた文書はやはりその時代の産物であることは免れ得ない。してみると、深く理解しようとしたら、書かれた当時の事情を知るに如くはない。 時代背景や常識というものをまるっきり無視して、言葉尻だけをとらえてあげつらうのは、(規格の草案を練り直すときには有益かもしれないとしても) 現実世界への適用においてはあ

    mojiura
    mojiura 2007/11/05
    コメント欄。「一部業界の自主規制」というところ、なるほど、と思った。確かに自主規制だ。私はかなり「一部業界」よりの人間なので、「一部業界」以外の状況がいまひとつわからない。偏ってるなあ、と反省。
  • フォントの字体変更は文字コードの話題か?: 文字符号化blog

    JIS X 0213:2004が (包摂の範囲内で) 例示字形を変更したために、この変更に追随して字体設計を変更するフォントがいくつかあるようです。「辻」のしんにょうが1点か2点か、というのはこのレベルの話です。さて、これは文字コードの話題でしょうか? 文字コードとは、文字とバイト表現との対応を規定するものです。あるバイト表現に対応する文字がどのような字体をとるかは、包摂の範囲内において、設計者の方針次第です。文字コードの問題ではありません。JIS X 0208/0213では、しんにょうの点が1点か2点かは、文字コードとして区別しないことが明記されています。 なので、「辻」のしんにょうの点の数の如き問題は、文字コードの話題ではありません。フォントの話です。文字コードについて雑誌記事などを書く人におかれては、是非こうした区別に敏感であってほしいと思います。 補足すると、字体変更が包摂規準の範

    mojiura
    mojiura 2007/10/30
    たとえば書籍を「活字」と言い、信号の緑を「青」と言うのと同じで、「文字符号化+文字集合+フォント+文字コード変換処理+……」のことを「文字コード」と言うのだと思う。それが普通の日本語だと思う。
  • 1