タグ

ブックマーク / www.asahi-net.or.jp/~ax2s-kmtn (7)

  • http://www.asahi-net.or.jp/~ax2s-kmtn/character/japan.html

  • ASCIIとユニコード

    コンピュータは、文字ひとつひとつに与えてあるコード番号(英数字、記号の組み合わせ)で文字を認識するのですが、英語圏では、使用される文字数は、アルファベットと数字、それに記号とで合計100種類程度です。これに空白(スペース)や改行、タブ(数桁ぶんの空白を意味する記号)、コンピュータを制御するための制御記号などを加えても、合計で128種類(7ビット)で、すべての文字を表現することができます。 ASCII(アスキー;American Standard Code for Information Interchange)は、アメリカのJISに相当する団体であるANSIが1963年に制定した文字コードです。ASCIIは世界中に広まり、ASCIIをもとにして1967年にISO R 646という国際的な推奨規格が制定され、これをもとに各国が自国の標準文字コードをつくりました。このISO R 646には、

    satoschi
    satoschi 2008/08/20
    URL変更のため再ブクマ。
  • CyberLibrarian - 分類

    新訂10版は2015年に出版されたが、奥付等の出版年は2014年とされている。 十進分類法は、あらゆる知識を1~9の数字を用いて分類(9分割)し、どの区分にも属さない全般的なものに0を用いる分類法です。そして、それらをさらに0~9に分けるという繰り返しで分類を細分化していきます。 例えば「753」という分類は、知識全体を0~9に分けたうちの「7 芸術. 美術」を0~9に細分化し、そのうちの「5 工芸」をさらに0~9に細分化したうちの「3 染織工芸」ということになります。そのため、「753」という分類は、「ななひゃくごじゅうさん」とは読まず、「ななごさん」と読みます。また、3次区分の後に識別の便宜的に小数点をつけて「753.2」と記述し、「ななごさんてんに」と読みます。 第1次区分を「類(ルイ)」、第2次区分を「綱(コウ)」、第3次区分を「目(モク)」と呼びます。 NDC新訂10版分類法(2

    satoschi
    satoschi 2008/06/26
  • JIS2004制定時の変更点 - CyberLibrarian

    2000年に定められたJIS X 0213(JIS拡張漢字)は2004年に改定され、JIS X 0213:2004になりました。JISの例示字形と表外漢字字体表の印刷標準字体とが異なっている178字のうち、168字を印刷標準字体に変更し、10字を新たに追加しています。10字を追加したのは、JISの例示字形と印刷標準字体の両方が既にUnicodeで別字として規定されているためです。下記は、その変更点です。一部の文字はUnicodeの数値文字参照で記述しているため、OSやブラウザのバージョンなどの環境によっては、文字化けする可能性があります。なお、経済産業省の報道発表(PDF)でも新旧の字体を見ることができます。 印刷標準字体に変更したもの(168字) これらには、字体を変更するもの、筆押さえの有無や接触の位置などのフォント間(平成明朝体とMS明朝体など)の微細なデザイン差を統一するもの、3部

  • JIS X 0208コード表 - CyberLibrarian

    JIS X 0208(JIS基漢字)の表です。 記号、英数字、かな(01区~08区) 区 点 JIS SJIS EUC +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 1 0 2120 813F A1A0

  • 文字サイズ - CyberLibrarian

    級とポイント 級(「Q」と略される)は写植文字の大きさの単位で、1級=0.25mm(1/4mm)です。これに対し、行間(行送り)の単位としては歯(「は」と読み、「H」と略される)が用いられ、大きさは級と同じです。 ポイント(「ポ」や「P」「pt」と略される)には、ヨーロッパで使用されている1ポイント=0.3759mmのディドー式(Didot Point System)と、英米で使用されている1ポイント=0.3514mmのアメリカ式(Anglo-American Point System)がありますが、JIS Z 8305:1962でアメリカ式を採用したため、日ではアメリカ式が使用されています。また、このほかにもパソコンでは1ポイント=約0.3528mm(1/72インチ)のDTPポイント(PostScript PointまたはComputer Point)を使用しています。 級数、ポイント

  • Unicode(東アジア) - CyberLibrarian

    Unicodeの字種の表です。 下表のリンク先のページに、十六進数の数値文字参照で記述した文字コード表を掲載しています。文字コード表中の各文字は、ユニコード・コンソーシアムが提供しているUnihanデータベースの該当文字へリンクしてあります。文字コード表中の文字は、環境によっては正しく表示されない場合がありますが、各ページからリンクしているPDFでは正しく表示されます。 字源的には同じだが字形の異なる中国語、日語、朝鮮語、ベトナム語の漢字に同じコードを与えて統合した漢字です。 CJK統合漢字、拡張Aと拡張Bには、JIS X 0213の漢字が含まれています。 拡張Bには、多数の重複字の存在が指摘されています。 拡張Fには、文字情報基盤整備事業が提案した漢字(1,645字)、大蔵経テキストデータベース研究会が提案した漢字(2,884字)も含まれています。 拡張Gには、大蔵経テキストデータベー

  • 1