[B! 文字コード] pomo123のブックマーク

pomo123 id:pomo123

文字コードに関するpomo123のブックマーク (16)

日本語と文字コード
コンピュータは主にアメリカで発達してきたため、未だにアルファベットや数字などの1バイト（7/8ビット）を基本単位として扱う前提で作られているものが中心です。そのなかで日本語のように多くの文字を必要とする言語は、1文字を表わすのに2バイト以上を要するため、いろいろな困難が伴います。特にインターネットを通じて様々な環境の情報を交換するにあたって、思わぬ問題に遭遇するケースが増えてきました。ここでは、こうしたことを考えるために必要な、日本語の文字コードに関する基本を整理しておきます。 JIS漢字コード（情報交換用符号化漢字集合）区点コード JISコード（符号化方式）シフトJISコード EUCコード ASCIIとJISローマ字 Unicode 主要コード規格のまとめ参考文献、リソース文字化けしたメールの復元 | The Web KANZAKI ホームページ JIS漢字コード（情報交換用符号
pomo123 2011/04/27
文字コード
リンク
文字コード表シフトJIS(Shift_JIS)
シフトJISの1バイトコード（半角文字）のエリア 0x00～0x1f、0x7f は制御コードです 0x20～0x7e はASCII文字です 0xa1～0xdf は半角カタカナですシフトJISの2バイトコード（全角文字）のエリア（JIS X 0208の漢字エリア）上位1バイト　 0x81～0x9f、 0xe0～0xef 下位1バイト　 0x40～0x7e、 0x80～0xfc ですが機種に依存しない観点より、ＨＴＭＬで以下の水色エリアは使用しないのが無難です水色エリアはJIS X 0208 (1990) to Unicode 漢字コード表に存在しないコードです 0x8540～ 0x889e　は機種依存文字の主なエリアです 0xeb40～ 0xeffc　はMacOS では縦書用文字、Windows では特殊な外字エリアです 0xf040～　は外字エリアです（記載していません） perlで
pomo123 2011/04/27
perl

文字コード
リンク
http://ash.jp/ash/src/codetbl/index.htm
pomo123 2011/04/27
文字コード
リンク
Web便利ツール/URLエンコード・デコードフォーム - TAG index Webサイト
URLエンコードとデコードが行えるフォームです。 URLエンコード、またはデコードのフォームに文字列を入力し、変換用のボタンをクリックしてください。マルチバイト文字だけをエンコードしたい場合は「URLエンコード（URL作成用）」をご利用ください。
pomo123 2008/09/10
tool

文字コード
リンク
図解: Perl と Unicode 文字列 - daily dayflower
id:tomi-ru さんが [http://e8y.net/mag/015-encode/:title] というとてもプラクティカルな [http://search.cpan.org/perldoc?Encode:title=Encode] 入門をお書きになったので，わたしも違う切り口で書いてみたくなりました。いちおうの基礎（読み飛ばし可）文字セット, キャラクタセット, 文字集合, 文字集合 - Wikipedia エンコーディング, 符号化方式, 文字符号化方式 - Wikipedia この2つは異なります。とくに知らなくても下記の文書を読むことはできますが，理解しているとためになります。くわしく知りたい人は自習してください。文字セットの例 Unicode JIS X 0208 ひらがなとかカタカナとか漢字とか ASCII 文字エンコーディングの例 UTF-8 ISO-202
pomo123 2008/06/20
perl

unicode

文字コード
リンク
それ Unicode で
UTF-7 を使ってスクリプトを記述 +ADw-SCRIPT+AD4-alert(\'XSS\');+ADw-+AC8-SCRIPT+AD4- IE は、文字エンコーディングが不明で UTF-7 っぽい文字列があれば、自動判別で UTF-7 となる。
pomo123 2006/12/14
hack

文字コード

windows
リンク
perluniintro - Perl Unicode の手引き - perldoc.jp
名前¶ perluniintro - Perl Unicode の手引き説明¶ This document gives a general idea of Unicode and how to use Unicode in Perl. このドキュメントは、Unicode の一般的な考えと、 PerlでUnicodeをどのように使うかを書いています。 Unicode¶ Unicode is a character set standard which plans to codify all of the writing systems of the world, plus many other symbols. Unicode は、キャラクタセットの標準です。世界の全ての書記体系と、それに加えて、他の多くのシンボルを体系化することを計画しています。 Unicode and ISO/IEC
pomo123 2006/12/07
perl

文字コード
リンク
Webページの文字コードをUTF-8にする方法(前編)
pomo123 2006/12/07
perl

文字コード
リンク
Perl-5.8 MEMO
Perl-5.8 覚え書き Last Updated at $Date: 2005/12/04 04:00:59 $. このページは，Perl-5.8.2 を使う上で困ったことなどの覚え書きです．日本語を含むスクリプトを書く日本語 EUC でスクリプトを書く UTF-8 でスクリプトを書く日本語を含むファイルを開く連想配列で日本語を使う日本語を含む正規表現文字コードの自動判定古い Perl でも実行できるように書く未解決の問題日本語を含むスクリプトを書く Perl-5.8.x で日本語を扱うスクリプトを書く場合，大きく2通りの方法があります．日本語 EUC でスクリプトを書く． UTF-8 でスクリプトを書く．どちらの方法でも， (1)ファイル入出力， (2)データベースアクセス， (3)プロセス間通信の3つに気をつけて，明示的にバイト列を文字列に変換したり，また逆
pomo123 2006/07/23
perl

文字コード
リンク
エスケープ処理された文字列を戻す - ぱるも日記
POST でパラメータを受け取るで作った echo.cgi に改行や日本語を含むテキストを送信してみると、ちゃんと表示されず「%」が含まれた文字列になってしまいますが、これは文字化けではありません。例えば、名前（name）に「ぱるも」、本文（body）に「こんにちは(改行)かわいい犬ですね」と書いて送信すると name %82%CF%82%E9%82%E0 body %82%B1%82%F1%82%C9%82%BF%82%CD%0D%0A%82%A9%82%ED%82%A2%82%A2%8C%A2%82%C5%82%B7%82%CBと表示されます。（Shift-JIS の場合）これは、パラメータがブラウザによって送信される時に「エスケープ処理」されているからです。TMPL_VAR の ESCAPE 属性でも勉強しましたが、エスケープ処理とは「特殊な記号の意味を打ち消す為の処理」です。
pomo123 2006/07/23
perl

文字コード
リンク
シフトJIS / EUC-JPとUnicodeとの妥当な変換表: Netsphere Laboratories
2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなければ、文字化けが発生することになる。おかしな変換表は、これまでは、特にLinuxなどの上で動作するオープンソースソフトウェアで多く見られた。おそらく規格原理主義者が多かったためだろう。そもそも、規格どおりに変換表を作ると、実用的な変換表にはならない。しかし、最近ではまともな変換表を実装しているものも増えてきて、うまく選ぶだけでいいようになってきている。変換表の違いをまとめたページはよく見かけるが、実際にどのような条件を満たして変換するものを選べばいいか不明なので、まとめてみた。変換表に求めら
pomo123 2006/06/28
文字コード
リンク
http://www.drk7.jp/MT/archives/2004_07_24.html
pomo123 2006/02/07
perl

文字コード
リンク
Perl-5.8 MEMO
Perl-5.8 覚え書き Last Updated at $Date: 2005/12/04 04:00:59 $. このページは，Perl-5.8.2 を使う上で困ったことなどの覚え書きです．日本語を含むスクリプトを書く日本語 EUC でスクリプトを書く UTF-8 でスクリプトを書く日本語を含むファイルを開く連想配列で日本語を使う日本語を含む正規表現文字コードの自動判定古い Perl でも実行できるように書く未解決の問題日本語を含むスクリプトを書く Perl-5.8.x で日本語を扱うスクリプトを書く場合，大きく2通りの方法があります．日本語 EUC でスクリプトを書く． UTF-8 でスクリプトを書く．どちらの方法でも， (1)ファイル入出力， (2)データベースアクセス， (3)プロセス間通信の3つに気をつけて，明示的にバイト列を文字列に変換したり，また逆
pomo123 2006/02/05
perl

文字コード
リンク
naoya.dyndns.org is offline
naoya.dyndns.org is currently offline. Please try again later. Questions about our services? Learn more at Dyn.com.
pomo123 2006/02/05
perl

文字コード
リンク
Perl5.8 での Unicode 文字列の注意点
Amazon Search とかを EUC ベースから UTF8 ベースで実装し直したのですが、場合によって length や substr 等の文字列関数で処理が違うことが判明。備忘録として記事にしました。 Perl5.8 では Unicode 文字列に対して UTF8 フラグという内部データを設けて、その有無によって文字単位で扱うかバイト単位で扱うかを決定しています。また UTF8 フラグの ON/OFF は utf8 モジュールのutf8::encode() と utf8::decode() によって操作できるようになっています。バイト単位でUnicode文字列を扱いたいときは、utf8::encode() によって、UTF8 フラグを OFF に、文字単位でUnicode文字列を扱いたいときは、utf8::decode() によって、UTF8 フラグを ON にする必要があります
pomo123 2006/02/04
perl

文字コード
リンク
Perl 5.8.x Unicode 関連
pomo123 2006/02/04
perl

unicode

文字コード
リンク
1