タグ

ブックマーク / toyohira.asablo.jp (8)

  • IPAフォントは新JIS漢字実践の救世主となるか: 文字符号化blog

    先日、IPAからIPAフォントの一般利用者向け配布が始まりました。JIS X 0213に対応しているというので早速ダウンロードしてみました。 5書体入りというのは大変おとくな感じです。ざっと見た感じ、品質も特に問題ない、というか、これだけのものが無料で入手できるというのは非常に恵まれていると思いました。 MSゴシックv.5.0だと、JIS第3・第4水準漢字が画面表示では汚かったりするのですが(ビットマップが入っていないように見える、が、実は入っているという話もあったりしてよく分からない)、IPAフォントではそんなことはなく、第1・第2水準と分け隔てない調子で綺麗に表示されます。 細かいところまではまだチェックしきれていませんが (例えばU+301Cの字体とか)、新JIS漢字実践のための強い味方になりそうな予感がします。

  • 規格の読み方: 文字符号化blog

    前の記事を書くために久しぶりに97JISを読んだのですが、ああ、やっぱりこれは1997年の規格なんだなということを感じました。 というのは、規格が書かれた当時の常識や技術的な背景というもの (それらの多くは現在でも通じるにしても) が、規格の文言の裏に透けて見えるわけです。 規格というのは、文面に書かれたものが全てであるかのように読み、それできちんと意味が通じるのが良いわけです。というのは、異なるベンダの実装者が別々に読んで実装したものが、きちんと相互運用できてほしいから。けれどもその一方で、書かれた文書はやはりその時代の産物であることは免れ得ない。してみると、深く理解しようとしたら、書かれた当時の事情を知るに如くはない。 時代背景や常識というものをまるっきり無視して、言葉尻だけをとらえてあげつらうのは、(規格の草案を練り直すときには有益かもしれないとしても) 現実世界への適用においてはあ

  • 文字コード的に見たフォント設計の自由度: 文字符号化blog

    JIS X 0208:1997の公開レビューがインターネットで行われていたのはご存じでしょうか。当時はFTPでレビュー資料をダウンロードする形態をとっていました。ネットニュース(fjニュースグループ)でお知らせが回っていたような覚えもあります。 レビュー資料のことはもうほとんど忘れてしまいましたが、FAQの中にイカした項目があったのは覚えています。たしか、低解像度のビットマップフォントなどで点画の省略をしても規格に適合するという話の後だったと思うのですが、 問: 1区1点から、区点位置をひとつずつずらして、「亜」の区点位置に「唖」の字形、「唖」の区点位置に「娃」、「娃」の位置に「阿」……として実装したフォントはこの規格に適合しますか? これなら、それぞれの文字は他のいかなる図形文字とも区別できますよ。 答:適合しません。区点位置に定義されている文字を想起できないからです。 なにぶん10年以

    funaki_naoto
    funaki_naoto 2007/10/31
    「しんにょうの点のがひとつかふたつかなどは書体設計者の自由ですが、世間一般でいう「辻」だと認識できないようなつくりであってはいけない」
  • フォントの字体変更は文字コードの話題か?: 文字符号化blog

    JIS X 0213:2004が (包摂の範囲内で) 例示字形を変更したために、この変更に追随して字体設計を変更するフォントがいくつかあるようです。「辻」のしんにょうが1点か2点か、というのはこのレベルの話です。さて、これは文字コードの話題でしょうか? 文字コードとは、文字とバイト表現との対応を規定するものです。あるバイト表現に対応する文字がどのような字体をとるかは、包摂の範囲内において、設計者の方針次第です。文字コードの問題ではありません。JIS X 0208/0213では、しんにょうの点が1点か2点かは、文字コードとして区別しないことが明記されています。 なので、「辻」のしんにょうの点の数の如き問題は、文字コードの話題ではありません。フォントの話です。文字コードについて雑誌記事などを書く人におかれては、是非こうした区別に敏感であってほしいと思います。 補足すると、字体変更が包摂規準の範

  • 文字コードに対する3つのスタンス: 文字符号化blog

    文字コードについての意見や議論は、その人の立場によって立脚点や基的なものの見方がかなり異なっており、そのことが相互の理解を難しくしていると感じることがあります。 私が考える3つのスタンスを図に表してみました。それぞれのスタンスをステレオタイプ的に描画すると以下のようになります。 プログラミング系 文字コードをバイト値として扱うことに詳しい。文字コードがどのような特徴を持っていればプログラミングが楽になるかという観点が強い。一方、コード値に対応する文字そのものがどう定義されているかにはあまり興味がない。文字の定義は規格を決めた人がうまくやっているはずだと考えている。「Unicodeさえあれば良い」と考えがちなのもこのタイプ。 フォント・活字書体系 フォント設計の微細なところまで知りつくしている。文字コード規格の例示字形に詳しく、常人には区別のつかないわずかな違いも見逃さない。フォント技術

  • 一般受けするのは難しい: 文字符号化blog

    Unicodeはなんの役に立つのかというと、世界のあちこちで使われるソフトウェアを開発しているソフトウェアベンダにとって内部処理が統一化できるのが嬉しいということが第一義であって、それ以外の人にはあまり関係がないように思います。 ソフトウェアの国際化というのは得てして地味くさい話が多いわけです。言語依存の部分を切り出して別リソースにまとめたりとか、アイコンを差し換えられるようにしたりとか。そういう仕掛けは開発する側 (もっというと、ソフトウェアを売る側) にとっては大事なのだけれども、普通の人にとってはメリットを感じにくい。各地域版の開発コストが下がったりということで間接的には利益を享受しているのですが、一般受けという面ではインパクトの弱さは否めない。 文字符号化に関して言えば、包摂規準の明確化なんていうのもいかにも一般受けしない話ではあります。これはテキストの符号化を真面目にやろうとすれ

  • JIS2004は字体を規定しない: 文字符号化blog

    前回触れたように、Windows Vistaに搭載されるフォントをめぐって、誤った記事が流布しています。典型的な誤解は、「JIS2004 (JIS X 0213:2004)を採用することで印刷標準字体に対応する」というものです。しかし既述の通り、JIS2004を採用したからといって印刷標準字体と同じ字体になるとは限りません。 規格を読めば、世間のニュースサイトの誤りが分かります。JIS X 0213を見てみましょう。 1. 適用範囲 この規格は、図形文字及びそのビット組合せを規定するもので、用途、個々の図形文字の具体的字形設計などは、この規格の適用範囲とはしない。 付属書6(規定) 漢字の分類及び配列 ここで示す例示字体、部首、画数、音訓などは、一般に用いられている漢字とこの規格でビット組合せを規定する図形文字との対応を示し、文字の同定を容易にするためだけに用いるのであって、漢字の字体・字

    funaki_naoto
    funaki_naoto 2005/10/12
    文字コードは、文字の符号化表現(ビット組合せ)を定めるものであって、字体を決めるものではない。
  • 遠望不明瞭: 文字符号化blog

    Windows VistaにJIS X 0213:2004対応の新日フォント「メイリオ」 (Internet Watch)という記事が出ています。 〔Microsoft製品に〕これまで搭載されてきた日フォントの字体は、基的に1990年改正のJIS規格による例示字体と同じもので、一般の書籍類で用いられている字体との間に不整合が生じていた。こうした問題を解消するために、JIS2004では「鴎」や「葛」などの字体を変更している。 ひとつめの文は正しい。しかし、ふたつめの文は誤りです。まず「鴎」の字体はJIS2004でも相変わらず「鴎」で、変わりありません。「區鳥」の字体は別の符号位置に追加されたものです。字体の変更ではありません。また、「葛」の例示字形は変更されましたが、変更前の字体でも規格に適合します。つまり、どちらの字体で表示しても良いのです。これもやはり、規格による「字体の変更」

    funaki_naoto
    funaki_naoto 2005/10/12
    「フォントをどう実装するかということは、文字コード規格だけで決められるものではありません」
  • 1