タグ

ブックマーク / www.arch.info.mie-u.ac.jp/~ohno (1)

  • Handling Character Code in C

    Cにおける文字コードの扱い 概要 Cで日語文字を扱う場合の問題 ツールを使った文字コード変換 各文字コードの概略とCでの処理コード例 ASCII EUC Shift_JIS UTF-8 UTF-8対応の関数ライブラリ 概要 C言語で文字を扱う際には、 各文字に異なる整数値を割り当てた「文字コード」を用います。 これによって、 実際には整数型の一種である char 型に文字を格納できますし(実際は対応する整数値を格納している)、 整数と同じ比較演算子を用いて文字同士の辞書順比較を行うことができます。 Cでは元々、アルファベット圏の文字を想定しているため、 任意の一文字を char型(1バイト)で表すことにしています。 Cの仕様として文字コードまで決められてはいませんが、 今日では一般的にASCIIが使われます。 しかし、これでは256種類の文字しか区別できず、 日語のように多数の文字を含

  • 1