タグ

charcodeに関するsnaka72のブックマーク (4)

  • 半角文字 - ASCIIコード

    ASCII 0〜31、及び127は制御コードです(下記参照)。 ASCII 32の「SP」はブランク(空白)を表します。制定時は制御コードでしたが、現在では「文字」とされています。 ASCII 92の「¥」(円記号)は、来のASCIIでは「\」(バックスラッシュ)となります。JIS C 6228(現JIS X 0202)で「¥」とされました。 ASCII 126の「〜」(チルダ)は、JIS C 6228(現JIS X 0202)では「 ̄」(オーバーライン)と規定されています(JISキーボードにもそう刻印されています)。しかし、Windows標準のフォントでは「〜」となっているため、初心者の混乱の元となっているようです。 制御コード(制御文字) 以下は小林龍生、安岡孝一、戸村哲、三上喜貴編「bit別冊─インターネット時代の文字コード」(共立出版)から引用した。ただし、一部修正してある。 S

  • 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。

    「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ

    文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。
    snaka72
    snaka72 2010/07/10
    セルクマ/図は Google Drawings で描いてみました。
  • International Register of Coded Character Sets

    View Register by Number View Register by Type (Select below) References Synopsis Table This is the ISO/IEC International Register of Coded Character Sets To Be Used With Escape Sequences for information interchange in data processing. It is compiled in accordance with the provisions of ISO/IEC 2022, "Code Extension Technique" and of ISO/IEC 2375 "Procedure for Registration of Escape Sequences".   

    snaka72
    snaka72 2010/07/09
    JIS X 0208 の文字コード表などが参照できる
  • 日本語文字コード

    フォームメール(mb_send_mail)php ジェネレーター オープンフォトライブラリー自由に画像を登録・紹介できます 文字コード(日語漢字コード表) 日語漢字コード表が、Shift-JIS、EUC-JP、JIS、UTF-8と複数存在する事から、 ホームページ作成・維持管理、データ収集をする上で、文字コードについての多くの諸問題が発生します。 その解決に少しでもお役に立てれば幸いです 文字コード表(実体) シフトJISコード表 Shift-JIS による一覧表 EUCコード表 EUC-JP による一覧表 JISコード表 JIS による一覧表 JIS X 0201 (1976) to Unicode 文字コード表 Shift-JIS による一覧表 JIS X 0208 (1990) to Unicode 漢字コード表 Shift-JIS による一覧表(UTF-8のコードはこちらにあり

  • 1