続・Encodeでラクラク日本語処理 - 2010 advent calendar casual Perl に関するちょっとした Tips をのっけてみるよ。ちゃんと続くかな? こんばんわ。現在ユクモ村にて療養中のid:hirataraです。ATNDにて予定していた順番と多少入れ変わっての登場ですが、よろ... 続きを読む
昨日の Twitter の XSS 騒ぎは、まだ皆さんの記憶に新しいことと思います。いい機会なので、ツイートのような構造化テキストのエスケープ手法について触れておきたいと思います。 Twitter のメッセージは、単なる平文(プレインテキスト)ではなく、「@英数字」... 続きを読む
2010/05/2715:36 あなたにも今日こそPerlの文字化けが理解できるたった一つの原則 こんにちは。ECナビラボの須藤(@ajiyoshi)と申します。 唐突です が、Perl(5.8以降)で文字化けに悩んだことはありませんか?私はあります。 そして、よくわからないまま"Perl 文... 続きを読む
こんにちは!ラブプラスとときメモ4の狭間で揺れ動いているxaicronです!! 今日は日本でプログラムを書いていたら避けては通れない気がする、Encodeの話をしようと思います! はじめに まず、この記事を読む前に、Perlのバージョンの確認をしてください。以下... 続きを読む
はてなでテーブル組めるのかわからなかったので画像で.Perl 5.8.x Unicode関連より.*1は一度encodeでフラグを落としてからdecodeをかければいいのかな、たぶん. utfフラグのチェックはutf8::is_utf8(調べたい文字列); #戻り値はブール値で。 続きを読む
以前、Catalystでマルチバイトを取り扱うときのまとめという記事を書いたのですが、情報が少し古いので、最近僕がやっている方法を紹介します。 この記事では Catalyst 5.7015 Catalyst::View::TT 0.27 Catalyst::Plugin::ConfigLoader 0.22 Catalyst::Plugin::... 続きを読む
エンコードの処理の基本 Perl 5.8 以降,テキストの処理が UTF-8 (Unicode の変換形式のひとつ) を軸におこなわれるようになりました。Shift JIS や EUC-JP での処理が一般的な日本語を Perl で扱う場合,エンコードを意識したプログラミングをおこなうことが必... 続きを読む
これは、実はPerlに限らず未だに事実だったりするのですが.... Perl でフォームデータから UTF-8 日本語文字をとりだす方法 (プログラミングの小石・大石)UTF-8 のフォームによっておくられたデータのなかから日本語文字をとりだすことは,日本の Perl CGI プロ... 続きを読む
id:otsuneに建設予定フラグがたてられていたので。 冬通りに消え行く制服ガールは、夢物語にリアルを求めない。 - subtech Perl の utf8 関係が未だ全く理解できない。わからないことがわからないので整理 #!/usr/bin/perl use strict; use warnings; use utf8 ... 続きを読む
ぎゃあぁぁ length関数で文字列の長さを求める - perl初心者BLOG - Hatena::Group::Perl日本語の文字数を正確に求めたい場合、use encodingを指定する use encoding;は、jperlなど、かつて存在したL10Nされたperl用に書かれたレガシースクリプトを、モダンperl... 続きを読む