タグ

ブックマーク / homepage1.nifty.com (2)

  • UCS-2とUTF-8

    最終更新 2003-11-11 UCSとUTF ユニコードで文書を作るとき,文字コードの方式が2種類,あるいはそれ以上あることに気が付かれるかもしれません。例えば,一つはUnicodeとあるのに対し,もう一つはUnicode (UTF-8)と表記されているかもしれません。この2つは,また,その違いは何でしょうか(前者はUTF-16の一形態なのですが…)。 UCS-2とUCS-4 ユニコードが採択されることになった多言語用の文字コードセット,ISO-10846-1は,16ビット(16桁の二進数)でそれぞれの文字を表します。それをUCS-2 (Universal Character Set coded in 2 octets,「2つのオクテットでコードされたユニバーサル文字セット」)と称します。オクテットとは文字長の単位としての8ビット(8桁の二進数)のことです。 ユニコードの特定の文字は,例

  • クリスマスの「X'mas」表記は誤字です。

    (1997年12月に、 「言葉の誤用の小ネタ」文に書いたネタを移動しました。) (正) Xmas Xマス (アポストロフィなし) (誤) X'mas X'マス (アポストロフィあり) なのだそうです。英和辞典(研究社)を見ると、確かに「X'mas は誤用」と書いてあります。 この言葉が日に入ってきたときに、「1997年」の意味の「'97」と混同したのかもしれません。 でも、「X'mas」は定着しまくっているので、慣用的にはOKということで仕方がない気もします。 さて、今年のテレビの字幕やCM、新聞や雑誌の表記はどっちが多いでしょうか。 ちなみに、いろんなサーチエンジンで「Xmas」と「X'mas」を検索してみたら、次のようになりました。(1997.12.6) ・goo … 「Xmas」 2449件、 「X'mas」 3171件 ・Yahoo! JAPAN … 「Xma

    MuneOchi
    MuneOchi 2007/12/18
    Christmas
  • 1