[B! Character-code] hamastaのブックマーク

文字コードの基本文献は？ - もじのなまえ

そういえば日曜日の「もじもじカフェ」、お出でくださった皆様どうもありがとうございました。いつも一番の楽しみは、終わった後の懇親会だったりするんですが、その席である学生さんから「文字コードを勉強するとっかかりになるような文章、ありませんか？」との質問が。ネット上で入手できて、信頼性が高く、しかも読んだ後に次のステップが見えてくるような文章。つまり基本文献ですね。もちろん、ぼくなどの原稿ではダメダメ。しばらく考えて挙げたのが以下のもの。皆さんならどんな文章を挙げますか？漢字・日本語処理技術の発展：漢字コードの標準化（芝野耕司）日本の漢字コードを前史の段階から詳述 JIS X 0221（ISO/IEC 10646）の目指すもの（芝野耕司） ISO/IEC 10646（Unicode)についての基本文献ならこれ文字コードと図書館（芝野耕司）標題にとどまらず、国際規格の歴史を詳述 JIS漢

hamasta 2006/12/02

Character-code

リンク

エンコーディング表記法メモ(Hishidama's Encoding Memo)

備忘 ASCII：American Standard Code for Information Interchange [2006-07-24] UTF：UCS/Unicode Transf ormation Format [2007-05-03] Windows-31J（MS932）は機種依存文字（「①」等）を含むが、Shift_JISは含まない。[2006-07-24] →Javaでの出力例 [2007-02-13] UnicodeとUTFの関係 Unicodeは、21ビットで1文字を表す文字コード体系。[2007-05-03] （Unicodeは、地球上の全世界の文字を1つの体系で表そうと試みているらしい。当初は16ビットとしていたが、足りなくなったので21ビットになったそうだ。16ビットを超える分は補助文字と呼ぶ）プログラミング言語の中では、文字列はUnicodeの配列で表せばよい

hamasta 2006/12/02

リンク

Yahoo! JAPANのソース  は何か意味があるのでしょうか？

<html> <head> <meta http-equiv="Content-Type" content="text/html; charset=euc-jp">  <title>Yahoo! JAPAN</title> この  は何か意味があるのでしょうか？お願いします。

hamasta 2006/08/02

Character-code

リンク

文字コードについて

文字コードについての実用的な説明です。このページの仕様にもとづいて作成した文字コード表や、16進ダンプを使った解説のページもあります。文字の種類 1バイト・2バイト文字は、ローマ字、カナ、記号などのJIS非漢字と、第1・第2・第3・第4水準のJIS漢字に分類され、JIS規格によって決められています。この他に、制御コードと呼ばれるデータがあり、文字と同様に扱っています。また漢字は、94×94の領域に1字づつ配置されています。この横の行を区、縦の列を点と呼び、区点番号で表すこともあります。これに対して、UCS（Universal Coded Character Set）のマルチバイト文字では、全世界の文字を扱えるようにISO/IECで決められた国際規格です。

hamasta 2006/07/26

＞実用的な説明

Character-code

リンク

ある nakagami の日記

hamasta 2006/07/26

リンク

JIS X 0208 (1990) to Unicode 漢字コード表

unicodeの変換表はユニコードコンソーシアムのものを使用しています JIS X 0208 (1990) to Unicode UTF-8、UTF-16のコードがない文字は実体で表示されていても自分の環境に依存している可能性があります機種に依存しない観点より、ＨＴＭＬでUTF-8、UTF-16のコードがない文字は使用すべきではありません逆にUTF-8、UTF-16のコードがあるのに実体が表示されない場合は（無いと思いますが）SJISでの自分の環境がよほど悪いと考えるべきです JIS X 0208 (1990) to Unicode 漢字コード表区点 JIS SJIS EUC UTF-8 UTF-16 実体(SJIS) 01 01 2121 8140 A1A1 E38080 3000 01 02 2122 8141 A1A2 E38081 3001 、 01 03 2123 814

hamasta 2006/07/25

UTF-8の文字コード

Character-code

リンク

ASCIIコード表

ASCIIコード表 10進16進文字 0 0x00 NUL（null文字) 1 0x01 SOH（ヘッダ開始） 2 0x02 STX（テキスト開始） 3 0x03 ETX（テキスト終了） 4 0x04 EOT（転送終了） 5 0x05 ENQ（照会） 6 0x06 ACK（受信ＯＫ） 7 0x07 BEL（警告） 8 0x08 BS（後退） 9 0x09 HT（水平タブ） 10 0x0a LF（改行） 11 0x0b VT（垂直タブ） 12 0x0c FF（改頁） 13 0x0d CR（復帰） 14 0x0e SO（シフトアウト） 15 0x0f SI（シフトイン） 16 0x10 DLE（データリンクエスケープ） 17 0x11 DC1（装置制御１） 18 0x12 DC2（装置制御２） 19 0x13 DC3（装置制御３） 20 0x14 DC4（装置制御４） 21 0x15 NAK（

hamasta 2006/07/25

オススメ

Character-code

リンク

komonet.ne.jp

We’re getting things ready Loading your experience… This won’t take long.

hamasta 2006/07/25

Character-code

リンク

[psl]ASCIIコード一覧表

ログ last updated on 新着情報リストフォームデコードサービスV2 郵便番号検索文字コードチェックサポート掲示板 PSLブログこのサイトについてトップページのアイコンたちサポートについてプライバシーポリシー著作権表示の削除をしたい方へお問い合わせ/依頼/申請窓口フリープログラム利用規約設置代行等に関する規約登録事業者リスト特商法に基づく表示設置代行サービスカスタマイズサービスオーダーメイドサービス手数料・設定項目一覧表 CGI・SSIの基礎の基礎読むとためになる本の紹介(3) 読むとためになる本の紹介(4) CGI環境変数 UNIXの基礎の基礎基本認証の方法 ASCIIコード一覧表文字化けする文字一覧表 "^"(0x5e)を含む文字一覧表 "|"(0x7c)を含む文字一覧表 SMTP応答コード一覧表アクセスカウンタアクセス統計版 v

hamasta 2006/07/25

Character-code

リンク

文字コード資料

hamasta 2006/07/25

文字コード解説　機種依存文字なども

Character-code

リンク

JIS, EUC, SJIS の漢字コードについて

back 3つの漢字コード現在、コンピュータ上で日本語テキストを表現するのに用いられている漢字コードはおもに 3種類ある (昔は区点コードというコード体系もあったが、今ではすたれてしまった)。その 3種類は次のようなものである。なお、最初に「0x」がつく文字列は、それが 16進数 (Hexadecimal) 表記であることを表す。 JIS漢字コード ASCII コード 0x21 〜 0x7E の文字 2つを組み合わせて 1つの漢字を表現する。制御文字 (文字コード 0x1F 以下の文字) と共有できる、7bit 転送でも表現できるなどの利点があるものの、漢字と通常の ASCII コード文字 (single-byte のアルファベット) が共存できない。このために「漢字 IN」と「漢字 OUT」という 2つの制御シーケンス (制御文字列) が導入されている。漢字 IN …

hamasta 2006/05/06

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

Character-codeに関するhamastaのブックマーク (11)

お知らせ

月間はてなブックマーク数ランキング（2026年4月）

今週のはてなブックマーク数ランキング（2026年4月第4週）

今週のはてなブックマーク数ランキング（2026年4月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス