タグ

文字コードに関するSRNのブックマーク (7)

  • ノーブレークスペース - Wikipedia

    コンピュータにおいて、ノーブレークスペース(英: no-break space, non-breaking space, NBSP)は、スペースの箇所での自動的な改行を防ぐ特殊なスペースである。非分割空白[1] [2][注釈 1]とも呼ばれる。HTMLのように空白文字の並びを1つのスペースにまとめるシステムで、行内に複数のスペースを入れるために使うこともできる。 HTMLでは、通常のスペースの幅のノーブレークスペースは   または   と表される。Unicodeでは U+00A0 に割り当てられている。その他の幅のノーブレークスペースも存在する(#変種を参照)。 英語などわかち書きをする言語において、文の途中で改行(行の折り返し)をする場合は単語と単語の間(スペース)で行う。テキスト処理ソフトは、スペースがある箇所はどこでも自動的な改行をしても良いものとみなすが、ノーブ

  • 中国語の文字コード

    中国語の文字コードについての解説ページです。 日語の文字コードについては、文字コードについてを参照してください。中国語についてのページもあります。 中国語の文字コードの種類 中国語には、繁体字(Traditional Chinese)と、簡体字(Simplified Chinese)があります。 繁体字は香港や台湾で使われていて、簡体字は中国土やシンガポールで使われています。 簡体字は、繁体字の画数を減らし、簡単に読み書きできるように改良したものですが、文字コード体系が全く異なるため、全く互換性はありません。 繁体字中国語の文字コードは、台湾のメーカー5社が策定した「Big5」がよく使われています。 ただ、Big5は、ISO-2022準拠でないため、「CNS11643(EUC_TW)」も作られました。 CNSは、Chinese National Standardsの略です。 簡体字中国

  • CJKの記号及び句読点 - ユニコード一覧表:Unicode(文字入力可能)

    CJKの記号及び句読点 ユニコード一覧表:Unicode(文字入力可能) CJK Symbols and Punctuation

  • バイナリとは - IT用語辞典

    バイナリ 【binary】 バイナリデータ / binary data / バイナリ形式 / binary format 概要 バイナリ(binary)とは、2値(の)、2進数(の)、2元(の)、などの意味を持つ英単語IT関連ではテキスト(文字)以外のデータ形式全般を総称してバイナリと呼ぶことが多い。 コンピュータはすべての情報を2進数の「0」と「1」が並んだビット列として表現する。このうち、何らかの文字コード規格に基づいて文字を表すデータを「テキストデータ」(テキスト形式)、そうでないものを「バイナリデータ」(バイナリ形式)と分類する。 バイナリ形式のデータの例としては画像や音声、動画などを記録したメディアデータ、実行可能形式のコンピュータプログラム(オブジェクトコード/バイナリコード)、圧縮データ、暗号データなどがある。 バイナリ形式におけるビット列のパターンと意味の対応関係はデータ

    バイナリとは - IT用語辞典
  • 転ばぬ先の文字コード入門(第1回)

    矢沢 久雄 この講座では,様々な角度から文字コードの仕組みを解き明かしていきます。文字コードとは,文字を表すコード(来数値でない情報を数値で表したもの)のことです。皆さんは,Webブラウザで表示した画面が文字化け(意味不明の文字が表示されること)した,という経験があるでしょう。文字化けは,Webブラウザ側で設定した文字コードと,Webページのファイルの文字コードの種類が違う場合に起こります。 文字コードのコード体系に,ASCII,JISコード,シフトJISコード,Unicode,EUCなどの種類があることをご存知でしょうか。具体的に分からなくても,名前だけは聞いたことがあるでしょう。文字コードの種類が異なれば,同じ文字を表す文字コードが異なり,それが文字化けの原因となるのです。ところが,文字化けに遭遇したら,それきり対処できない…という人が多いのではないでしょうか? そのような人にこそ読

    転ばぬ先の文字コード入門(第1回)
  • 文字コード規格の基礎:ITpro

    この記事は,日経ソフトウエア 1999年10月号に掲載したものです。それ以降の情報が盛り込まれていませんので,現在とは異なる場合があります。 文字コード規格の基礎を手早く理解したい場合などにお役立てください。 文字コードは間違いなく情報を交換するための「決まりごと」なので,正確を期すため厳密な仕様が規定されている。だが,その仕様そのものを実装するプログラムを作る場合を除けば,プログラマが仕様の詳細を隅々まで理解している必要はない。六法全書を読んでいなくても問題なく普段の生活ができるようなものだ。 ここでは,通常のプログラミングをするうえで必要と思われる範囲のことを,なるべく簡潔に説明したい。「半角カナ」のような呼び名は正確さを欠くものだが,多くの人に伝わりやすいので説明の中でも使っていく。説明を簡略化するため「正確な仕様を知りたいときは規格書そのものを必ず参照してほしい」と書きたいところだ

    文字コード規格の基礎:ITpro
  • 文字コード - Wikipedia

    文字コード(もじコード、英: character code)は、文字(キャラクタ)を通信やコンピュータで扱えるように、一文字一文字に固有の識別番号を与えて区別できるようにした、その対応関係についての規則のこと。 文字コードは、文字や記号やそれに類するものを、通信やコンピュータで扱うために、各文字や記号などに対して番号を与えた対応規則の体系である。通常、通し番号を与え、文字と番号の対応表が作成される。どの文字コードを使うか決まっている状況では、ある数(番号)が与えられるとそれに対応する文字や記号を特定することができる。 1870年代にはフランスの電信技術者のエミール・ボドーが、5ビットと文字・記号類を対応させるコードを発明し、1876年に、そのコードを用いる電信装置の特許をフランスで取得した(この装置に使われている5ビットのコードがBaudot Code(ボドー・コード)として知られるように

  • 1