タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

Character-codeに関するhamastaのブックマーク (11)

  • 文字コードの基本文献は? - もじのなまえ

    そういえば日曜日の「もじもじカフェ」、お出でくださった皆様どうもありがとうございました。いつも一番の楽しみは、終わった後の懇親会だったりするんですが、その席である学生さんから「文字コードを勉強するとっかかりになるような文章、ありませんか?」との質問が。 ネット上で入手できて、信頼性が高く、しかも読んだ後に次のステップが見えてくるような文章。つまり基文献ですね。もちろん、ぼくなどの原稿ではダメダメ。しばらく考えて挙げたのが以下のもの。皆さんならどんな文章を挙げますか? 漢字・日語処理技術の発展:漢字コードの標準化(芝野耕司) 日の漢字コードを前史の段階から詳述 JIS X 0221(ISO/IEC 10646)の目指すもの(芝野耕司) ISO/IEC 10646(Unicode)についての基文献ならこれ 文字コードと図書館(芝野耕司) 標題にとどまらず、国際規格の歴史を詳述 JIS漢

    文字コードの基本文献は? - もじのなまえ
  • エンコーディング表記法メモ(Hishidama's Encoding Memo)

    備忘 ASCII:American Standard Code for Information Interchange [2006-07-24] UTF:UCS/Unicode Transformation Format [2007-05-03] Windows-31J(MS932)は機種依存文字(「①」等)を含むが、Shift_JISは含まない。[2006-07-24] →Javaでの出力例 [2007-02-13] UnicodeとUTFの関係 Unicodeは、21ビットで1文字を表す文字コード体系。[2007-05-03] (Unicodeは、地球上の全世界の文字を1つの体系で表そうと試みているらしい。当初は16ビットとしていたが、足りなくなったので21ビットになったそうだ。16ビットを超える分は補助文字と呼ぶ) プログラミング言語の中では、文字列はUnicodeの配列で表せばよい

  • Yahoo! JAPANのソース <!--京--> は何か意味があるのでしょうか?

    <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=euc-jp"> <!--京--> <title>Yahoo! JAPAN</title> この <!--京--> は何か意味があるのでしょうか? お願いします。

  • 文字コードについて

    文字コードについての実用的な説明です。 このページの仕様にもとづいて作成した文字コード表や、16進ダンプを使った解説のページもあります。 文字の種類 1バイト・2バイト文字は、ローマ字、カナ、記号などのJIS非漢字と、第1・第2・第3・第4水準のJIS漢字に分類され、JIS規格によって決められています。 この他に、制御コードと呼ばれるデータがあり、文字と同様に扱っています。 また漢字は、94×94の領域に1字づつ配置されています。 この横の行を区、縦の列を点と呼び、区点番号で表すこともあります。 これに対して、UCS(Universal Coded Character Set)のマルチバイト文字では、全世界の文字を扱えるようにISO/IECで決められた国際規格です。

    hamasta
    hamasta 2006/07/26
    >実用的な説明
  • ある nakagami の日記

  • JIS X 0208 (1990) to Unicode 漢字コード表

    unicodeの変換表はユニコードコンソーシアムのものを使用しています JIS X 0208 (1990) to Unicode UTF-8、UTF-16のコードがない文字は実体で表示されていても自分の環境に依存している可能性があります 機種に依存しない観点より、HTMLでUTF-8、UTF-16のコードがない文字は使用すべきではありません 逆にUTF-8、UTF-16のコードがあるのに実体が表示されない場合は(無いと思いますが)SJISでの自分の環境がよほど悪いと考えるべきです JIS X 0208 (1990) to Unicode 漢字コード表 区 点 JIS SJIS EUC UTF-8 UTF-16 実体(SJIS) 01 01 2121 8140 A1A1 E38080 3000 01 02 2122 8141 A1A2 E38081 3001 、 01 03 2123 814

    hamasta
    hamasta 2006/07/25
    UTF-8の文字コード
  • ASCIIコード表

    ASCIIコード表 10進16進文字 0 0x00 NUL(null文字) 1 0x01 SOH(ヘッダ開始) 2 0x02 STX(テキスト開始) 3 0x03 ETX(テキスト終了) 4 0x04 EOT(転送終了) 5 0x05 ENQ(照会) 6 0x06 ACK(受信OK) 7 0x07 BEL(警告) 8 0x08 BS(後退) 9 0x09 HT(水平タブ) 10 0x0a LF(改行) 11 0x0b VT(垂直タブ) 12 0x0c FF(改頁) 13 0x0d CR(復帰) 14 0x0e SO(シフトアウト) 15 0x0f SI(シフトイン) 16 0x10 DLE(データリンクエスケープ) 17 0x11 DC1(装置制御1) 18 0x12 DC2(装置制御2) 19 0x13 DC3(装置制御3) 20 0x14 DC4(装置制御4) 21 0x15 NAK(

    hamasta
    hamasta 2006/07/25
    オススメ
  • komonet.ne.jp

    We’re getting things ready Loading your experience… This won’t take long.

  • [psl]ASCIIコード一覧表

    ログ last updated on 新着情報リスト フォームデコードサービスV2 郵便番号検索 文字コードチェック サポート掲示板 PSLブログ このサイトについて トップページのアイコンたち サポートについて プライバシーポリシー 著作権表示の削除をしたい方へ お問い合わせ/依頼/申請窓口 フリープログラム利用規約 設置代行等に関する規約 登録事業者リスト 特商法に基づく表示 設置代行サービス カスタマイズサービス オーダーメイドサービス 手数料・設定項目一覧表 CGI・SSIの基礎の基礎 読むとためになるの紹介(3) 読むとためになるの紹介(4) CGI環境変数 UNIXの基礎の基礎 基認証の方法 ASCIIコード一覧表 文字化けする文字一覧表 "^"(0x5e)を含む文字一覧表 "|"(0x7c)を含む文字一覧表 SMTP応答コード一覧表 アクセスカウンタ アクセス統計版 v

  • 文字コード資料

    hamasta
    hamasta 2006/07/25
    文字コード解説 機種依存文字なども
  • JIS, EUC, SJIS の漢字コードについて

    back 3つの 漢字コード 現在、コンピュータ上で日語テキストを表現するのに用いられている 漢字コードはおもに 3種類ある (昔は区点コードというコード体系も あったが、今ではすたれてしまった)。その 3種類は次のようなものである。 なお、最初に「0x」がつく文字列は、それが 16進数 (Hexadecimal) 表記であることを表す。 JIS漢字コード ASCII コード 0x21 〜 0x7E の文字 2つを組み合わせて 1つの 漢字を表現する。制御文字 (文字コード 0x1F 以下の文字) と共有できる、7bit 転送でも表現できる などの利点があるものの、漢字と通常の ASCII コード文字 (single-byte のアルファベット) が 共存できない。このために「漢字 IN」と「漢字 OUT」という 2つの 制御シーケンス (制御文字列) が導入されている。 漢字 IN …

  • 1