[B! 文字コード][perl] pomo123のブックマーク

文字コード表シフトJIS(Shift_JIS)

シフトJISの1バイトコード（半角文字）のエリア 0x00～0x1f、0x7f は制御コードです 0x20～0x7e はASCII文字です 0xa1～0xdf は半角カタカナですシフトJISの2バイトコード（全角文字）のエリア（JIS X 0208の漢字エリア）上位1バイト　 0x81～0x9f、 0xe0～0xef 下位1バイト　 0x40～0x7e、 0x80～0xfc ですが機種に依存しない観点より、ＨＴＭＬで以下の水色エリアは使用しないのが無難です水色エリアはJIS X 0208 (1990) to Unicode 漢字コード表に存在しないコードです 0x8540～ 0x889e　は機種依存文字の主なエリアです 0xeb40～ 0xeffc　はMacOS では縦書用文字、Windows では特殊な外字エリアです 0xf040～　は外字エリアです（記載していません） perlで

pomo123 2011/04/27

リンク

図解: Perl と Unicode 文字列 - daily dayflower

id:tomi-ru さんが [http://e8y.net/mag/015-encode/:title] というとてもプラクティカルな [http://search.cpan.org/perldoc?Encode:title=Encode] 入門をお書きになったので，わたしも違う切り口で書いてみたくなりました。いちおうの基礎（読み飛ばし可）文字セット, キャラクタセット, 文字集合, 文字集合 - Wikipedia エンコーディング, 符号化方式, 文字符号化方式 - Wikipedia この2つは異なります。とくに知らなくても下記の文書を読むことはできますが，理解しているとためになります。くわしく知りたい人は自習してください。文字セットの例 Unicode JIS X 0208 ひらがなとかカタカナとか漢字とか ASCII 文字エンコーディングの例 UTF-8 ISO-202

pomo123 2008/06/20

リンク

perluniintro - Perl Unicode の手引き - perldoc.jp

名前¶ perluniintro - Perl Unicode の手引き説明¶ This document gives a general idea of Unicode and how to use Unicode in Perl. このドキュメントは、Unicode の一般的な考えと、 PerlでUnicodeをどのように使うかを書いています。 Unicode¶ Unicode is a character set standard which plans to codify all of the writing systems of the world, plus many other symbols. Unicode は、キャラクタセットの標準です。世界の全ての書記体系と、それに加えて、他の多くのシンボルを体系化することを計画しています。 Unicode and ISO/IEC

pomo123 2006/12/07

リンク

Webページの文字コードをUTF-8にする方法(前編)

pomo123 2006/12/07

リンク

Perl-5.8 MEMO

Perl-5.8 覚え書き Last Updated at $Date: 2005/12/04 04:00:59 $. このページは，Perl-5.8.2 を使う上で困ったことなどの覚え書きです．日本語を含むスクリプトを書く日本語 EUC でスクリプトを書く UTF-8 でスクリプトを書く日本語を含むファイルを開く連想配列で日本語を使う日本語を含む正規表現文字コードの自動判定古い Perl でも実行できるように書く未解決の問題日本語を含むスクリプトを書く Perl-5.8.x で日本語を扱うスクリプトを書く場合，大きく2通りの方法があります．日本語 EUC でスクリプトを書く． UTF-8 でスクリプトを書く．どちらの方法でも， (1)ファイル入出力， (2)データベースアクセス， (3)プロセス間通信の3つに気をつけて，明示的にバイト列を文字列に変換したり，また逆

pomo123 2006/07/23

リンク

エスケープ処理された文字列を戻す - ぱるも日記

POST でパラメータを受け取るで作った echo.cgi に改行や日本語を含むテキストを送信してみると、ちゃんと表示されず「%」が含まれた文字列になってしまいますが、これは文字化けではありません。例えば、名前（name）に「ぱるも」、本文（body）に「こんにちは(改行)かわいい犬ですね」と書いて送信すると name %82%CF%82%E9%82%E0 body %82%B1%82%F1%82%C9%82%BF%82%CD%0D%0A%82%A9%82%ED%82%A2%82%A2%8C%A2%82%C5%82%B7%82%CBと表示されます。（Shift-JIS の場合）これは、パラメータがブラウザによって送信される時に「エスケープ処理」されているからです。TMPL_VAR の ESCAPE 属性でも勉強しましたが、エスケープ処理とは「特殊な記号の意味を打ち消す為の処理」です。

pomo123 2006/07/23

リンク

http://www.drk7.jp/MT/archives/2004_07_24.html

pomo123 2006/02/07

リンク

Perl-5.8 MEMO

Perl-5.8 覚え書き Last Updated at $Date: 2005/12/04 04:00:59 $. このページは，Perl-5.8.2 を使う上で困ったことなどの覚え書きです．日本語を含むスクリプトを書く日本語 EUC でスクリプトを書く UTF-8 でスクリプトを書く日本語を含むファイルを開く連想配列で日本語を使う日本語を含む正規表現文字コードの自動判定古い Perl でも実行できるように書く未解決の問題日本語を含むスクリプトを書く Perl-5.8.x で日本語を扱うスクリプトを書く場合，大きく2通りの方法があります．日本語 EUC でスクリプトを書く． UTF-8 でスクリプトを書く．どちらの方法でも， (1)ファイル入出力， (2)データベースアクセス， (3)プロセス間通信の3つに気をつけて，明示的にバイト列を文字列に変換したり，また逆

pomo123 2006/02/05

リンク

naoya.dyndns.org is offline

naoya.dyndns.org is currently offline. Please try again later. Questions about our services? Learn more at Dyn.com.

pomo123 2006/02/05

リンク

Perl5.8 での Unicode 文字列の注意点

Amazon Search とかを EUC ベースから UTF8 ベースで実装し直したのですが、場合によって length や substr 等の文字列関数で処理が違うことが判明。備忘録として記事にしました。 Perl5.8 では Unicode 文字列に対して UTF8 フラグという内部データを設けて、その有無によって文字単位で扱うかバイト単位で扱うかを決定しています。また UTF8 フラグの ON/OFF は utf8 モジュールのutf8::encode() と utf8::decode() によって操作できるようになっています。バイト単位でUnicode文字列を扱いたいときは、utf8::encode() によって、UTF8 フラグを OFF に、文字単位でUnicode文字列を扱いたいときは、utf8::decode() によって、UTF8 フラグを ON にする必要があります

pomo123 2006/02/04

リンク

Perl 5.8.x Unicode 関連

pomo123 2006/02/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (1)

文字コードとperlに関するpomo123のブックマーク (11)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス