タグ

2008年9月1日のブックマーク (4件)

  • JIS X 0213 (JIS2004) の代表的な符号化方式

    (1面の終端バイト51は、この規格の2000年版のISO-2022-JP-3では4fでした) ただし、ISO-2022-JPとの互換性のため、1面の指示には「1b 24 42」を使 うこともできます。この指示を行った状態では、規格票の附属書2表1(64ペー ジ) および追補1の附属書2表2 (追補1の20ページ)にある文字を使用することはできません〔編注: 表を自作する予定〕。使っ てはいけない文字は、JIS X 0208に無い文字、包摂規準が変更された文字が中 心です。これらの文字を表すには必ず「1b 24 28 51」の指示を使わなければ なりません。 また、ISO-2022-JP-3との互換性のため、1面の指示には「1b 24 28 4f」を 使うこともできます。このときは、追補1の附属書2表2 (追補1の20ページ)に ある文字を使用することはできません。 さらに、状態について以下

  • 使いこなそうユニコード

    UCSとUTFとは? [2003-11-11] Unicode正規化とは [2008-01-14] Unicodeに関するメモ [2002-06-15] JIS X 0213とUCS/Unicodeとの対応について [2006-12-30] Unicode文字の表示例 (Unicode 4.1.0) [2005-04-23] JIS/SHIFTJISとWINDOWS/CP932との相違 [2001-07-08] JIS X 0208とUnicodeとの対応表/ZIP版 [2002-06-01] Shift_JIS-2004 (JIS X 0213:2004)とUnicode 3.2.0の対応表/ZIP版 [2007-01-03] [同じくShift_JIS-2004 (JIS X 0213:2004)とUnicode 3.2.0の対応表/非圧縮テキスト] ・JIS X 0213:2000

  • UCS-2とUTF-8

    最終更新 2003-11-11 UCSとUTF ユニコードで文書を作るとき,文字コードの方式が2種類,あるいはそれ以上あることに気が付かれるかもしれません。例えば,一つはUnicodeとあるのに対し,もう一つはUnicode (UTF-8)と表記されているかもしれません。この2つは,また,その違いは何でしょうか(前者はUTF-16の一形態なのですが…)。 UCS-2とUCS-4 ユニコードが採択されることになった多言語用の文字コードセット,ISO-10846-1は,16ビット(16桁の二進数)でそれぞれの文字を表します。それをUCS-2 (Universal Character Set coded in 2 octets,「2つのオクテットでコードされたユニバーサル文字セット」)と称します。オクテットとは文字長の単位としての8ビット(8桁の二進数)のことです。 ユニコードの特定の文字は,例

    cnomiya
    cnomiya 2008/09/01
    UTF-16では,UCS-4にあってUCS-2にない文字のうち,U+10000からU+10FFFFの範囲を,(unicode consortiumのいうところの)サロゲートペアとして表します。
  • 株式会社マジカジャパンの羽生章洋が書いてるブログ:部分と全体 - livedoor Blog(ブログ)

    私は元システムエンジニアです。最近ではプログラマの復権ということが言われており、その反動でシステムエンジニアというものを忌避するきらいが見受けられます。ですが私はシステムエンジニアという名前も仕事も大好きです。 システム開発とは総合的なものだと考えています。プログラミングだけを積み重ねれば良いシステムができるわけではありません。それはちょうどバンド活動や映画製作などにも似ています。いくらギターが上手くてもそれだけでは素敵なライブはやれません。素晴らしい曲をひとつ作ってもそれだけでは1時間は持たせられません。映画も同じです。良い脚があってもカメラワークが拙いと上手くいきません。自動車だってエンジンだけが素晴らしくても駄目でしょう。他にも色んな例を挙げられますが、ここでは割愛します。 部分に没頭するが好きな人は、ともすればその延長に演繹的に素晴らしい結果が出るはずだと考えがちのようです。もち

    cnomiya
    cnomiya 2008/09/01
    ではどういう全体にするのか、ということについて成行きに任せても上手くいかないでしょう。全体を大きく捉えて考える。どういう全体にするのかという意思決定をする。そういうことをやる必要があるものもあります。