タグ

書評と文字コードに関するak7kagekiyoのブックマーク (2)

  • 「プログラマのための文字コード技術入門」 - 名もないテクノ手

    DTPの仕事に携わる人は、毎日多くのテキストを扱っているにもかかわらず、文字コードのことは案外無頓着でいたりします。Excelからテキストを書き出しては「バケラッター」と言い、メールにファイルを添付しては「バケラッター」といいつつ、その原因を探ろうとはしません。とても不思議なことです。 文字コードがこんなにも複雑で、プロフェッショナルな人にとっても優しくないという原因はいくつか考えられます。ひとつには、文字コードの混沌の黒歴史があり、さまざまな方式の文字データが存在すること。いくつかの文字集合や符号化方式、エンディアンの違い、フォントによる字形差や文字集合差などが問題をわかりにくくしています。テキストデータは、いまやもっとも判読しにくいフォーマットのひとつかもしれません。ひとつの符号化方式を支持することは、ある種の宗教にさえなっています。こわいこわい。 だから黙って、エディタの自動変換にす

    「プログラマのための文字コード技術入門」 - 名もないテクノ手
    ak7kagekiyo
    ak7kagekiyo 2010/03/02
    DTP業界の方から。「Excelからテキストを書き出しては『バケラッター』と言い、メールにファイルを添付しては『バケラッター』といい…」
  • 2010-02-14 - 未来のいつか/hyoshiokの日記

    例えば、次の言葉の意味を知りたい、聞いたことがあるけどよく分かっていないプログラマにとって、お勧めの書籍だ。Unicode/UTF-8/UTF-16/USC-2/JIS X0208/JIS X0212/JIS X0213/SJIS/EUC-JP/CP932/ISO-2022-JP/ASCII/Latin-1/ISO 10646/ISO 8859-1/サロゲートペア/文字化け/機種依存文字/半角カナ/絵文字… JIS X0208やJIS X0213の解説などは圧巻である。書籍にはWebにない利点がある。Webには即時性があるが、文字コードの解説においては、即時性はそれほど求められない。字体ないし字形の差異についてWebではその字体ないし字形がなければ表現しようがないが、書籍であれば細部までこだわって表現できる。 例えば、包摂された「辻」という字の一点しんにょうと二点しんにょうの字体の差はWe

    2010-02-14 - 未来のいつか/hyoshiokの日記
    ak7kagekiyo
    ak7kagekiyo 2010/03/02
    Ruby1.9のあれの解説もあり。「1988年のころ…錚々たる委員がいる委員会の末席を汚していたのが20代の若造であるわたしだった。」
  • 1