タグ

2005年11月10日のブックマーク (6件)

  • 文字コードについて

    文字コードについての実用的な説明です。 このページの仕様にもとづいて作成した文字コード表や、16進ダンプを使った解説のページもあります。 文字の種類 1バイト・2バイト文字は、ローマ字、カナ、記号などのJIS非漢字と、第1・第2・第3・第4水準のJIS漢字に分類され、JIS規格によって決められています。 この他に、制御コードと呼ばれるデータがあり、文字と同様に扱っています。 また漢字は、94×94の領域に1字づつ配置されています。 この横の行を区、縦の列を点と呼び、区点番号で表すこともあります。 これに対して、UCS(Universal Coded Character Set)のマルチバイト文字では、全世界の文字を扱えるようにISO/IECで決められた国際規格です。

  • 文字コードの墓場 - しいしせねっと

    Last update  日語には、いろんな文字コードがあります。 ややこしすぎるので、嫌です。 文字集合 エンコード + 文字コード 変換表 基礎知識 文字セット、エンコード(符号化方式)、2種類にわけて、この組み合わせで1つの文字コードになります。Unicodeをベースにしていることもあるのでさらに変換表的なものも加わると恐ろしいぐらいいろいろあります。 文字セットは、JISの場合、区点番号という区(row)と点(cell)と呼ばれる2つのコードを合わせて漢字1文字を指定します。区と点は1バイト目と2バイト目のような関係です。JISの区点はそれぞれ1〜94です。JIS X 0213やUnicodeになると区点では不足するため面(plane)という区点を区別するコードを加え、面区点の3つで区別します。 ISO-10646などでは、面区点でも不足する可能性があるため群(group)とい

  • 日本語と文字コード

    コンピュータは主にアメリカで発達してきたため、未だにアルファベットや数字などの1バイト(7/8ビット)を基単位として扱う前提で作られているものが中心です。そのなかで日語のように多くの文字を必要とする言語は、1文字を表わすのに2バイト以上を要するため、いろいろな困難が伴います。特にインターネットを通じて様々な環境の情報を交換するにあたって、思わぬ問題に遭遇するケースが増えてきました。ここでは、こうしたことを考えるために必要な、日語の文字コードに関する基を整理しておきます。 JIS漢字コード(情報交換用符号化漢字集合) 区点コード JISコード(符号化方式) シフトJISコード EUCコード ASCIIとJISローマ字 Unicode 主要コード規格のまとめ 参考文献、リソース 文字化けしたメールの復元 | The Web KANZAKI ホームページ JIS漢字コード(情報交換用符号

  • Yet Another仕事のツール

    Copyright (C) Mainichi Communications Inc. All rights reserved. 掲載記事の無断転載を禁じます

  • Loading...

    kirohia
    kirohia 2005/11/10
    シェル拡張について書いてある。
  • 進め!中級プログラマー

    第2号ついに完成! 中級プログラマの中級プログラマによる中級プログラマのためのWebマガジン「進め!中級プログラマー」がついに第2号にいたりました。(ぱちぱち) ここでは、僕が Windowsプログラミングの学習をする過程で作成したドキュメントを基に、毎号一つのテーマを決めて Windowsプログラミングに関する概念やテクニックを掲載していく予定としています。 プロ・アマを問わずウィンドウズプログラミングに興味のある皆様のお役に立てれば幸いです。 今のところ、主にInprise社の「Delphi」及び「C++ Builder」に関する話題を中心に構成していく予定としていますが、余裕ができてくれば「Java」やプログラミングに関する一般的な話題についても加えていきたいと思っています。 上でも触れましたとおり、この「進め!中級プログラマー」は僕がかなりアバウトに作成したドキュメントが基となって

    kirohia
    kirohia 2005/11/10
    シェルプログラミングに詳しい。