「文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか?日... 続きを読む
10:07携帯用ページなどを作成する際、全角カタカナを半角として表示させたい時があります。#!/usr/bin/perl use strict;use utf8;use Unicode::Japanese; my $str_h = ' 012ABCabc!@#アイウガダパ';my $str_z = ' 012ABCabc!@#アイウガダパ'; print "... 続きを読む
Unicodeにおける全角・半角の概念を解説します。 全角と半角 全角・半角の慣例 全角と半角という用語は印刷とか組版の用語なんだそうです。 全角は文字の縦横比が1:1、半角は2:1ということらしいです。 Shift_JISのようなANSIエンコーディングでは、 慣例的に... 続きを読む
これは、実はPerlに限らず未だに事実だったりするのですが.... Perl でフォームデータから UTF-8 日本語文字をとりだす方法 (プログラミングの小石・大石)UTF-8 のフォームによっておくられたデータのなかから日本語文字をとりだすことは,日本の Perl CGI プロ... 続きを読む
The requested blog was not found on this server -- unless you requested that of Dan Kogai (小飼 弾). その理由とは、「\p{}は本当に利用されるまで評価されない」というものです。 わかりやすくするために、以下に例を示します。 'ok' =~ /no\p{IsBogus}/... 続きを読む
というわけで私めが。 Rauru Blog - Blog Archive - perl 正規表現での Unicode Propertyperl 5.8.* のパターンマッチで、\p での Unicode 属性を使う場合なんですが、不正な属性名を指定した場合にエラーになるかならないかがどこで分かれるか、ってご存知の方... 続きを読む
id:otsuneに建設予定フラグがたてられていたので。 冬通りに消え行く制服ガールは、夢物語にリアルを求めない。 - subtech Perl の utf8 関係が未だ全く理解できない。わからないことがわからないので整理 #!/usr/bin/perl use strict; use warnings; use utf8 ... 続きを読む
ぎゃあぁぁ length関数で文字列の長さを求める - perl初心者BLOG - Hatena::Group::Perl日本語の文字数を正確に求めたい場合、use encodingを指定する use encoding;は、jperlなど、かつて存在したL10Nされたperl用に書かれたレガシースクリプトを、モダンperl... 続きを読む
普通では考えられない優遇策--「Google提案」を振り返る 皆さんこんにちは、毎度おなじみ(?)文字コード漫談の時間がやってまいりました。前回が3月の掲載ですから3カ月ぶりですか。今まで3回にわたって絵文字をUnicode及びISO/IEC 10646(国際符号化文字集合... 続きを読む
perlid:tomi-ru さんが use Encode; - 今日のCPANモジュール というとてもプラクティカルな Encode 入門をお書きになったので,わたしも違う切り口で書いてみたくなりました。 いちおうの基礎(読み飛ばし可) 文字セット, キャラクタセット, 文字集合, 文字集... 続きを読む
いわゆる[全半]角を考慮して、いわゆる全角を2、いわゆる半角を1と数えたいようなケースでは、どうやったらいいか。オードリたんの Unicode::EastAsianWidth を使うといいかも。Unicode::EastAsianWidth を使うと、\p{InFullwidth} と \p{InHalfwidth} を正規表... 続きを読む