Don't use DBIx::Class::UTF8Columns - JPerl Advent Calendar 2009 Perl に関するちょっとした Tips をのっけてみるよ。ちゃんと続くかな? 自分のつくったもジュールを紹介するハッカートラックということで、僕は DBIx::Class に同封されている DBIx::Class:... 続きを読む
use utf8プラグマ以下では「=>」の左辺にフラグが付くということが分かって以降、URI::query_form()使用時におきるエラーは全部解消。8:13 AM Aug 19th from P3:PeraPeraPrv 続きを読む
perl use strict; use warnings; sub Dump { @_ = map { sprintf "'%s'(%s)", $_, utf8::is_utf8($_) ? 'utf8' : 'bytes' } @_; print {*STDERR} join(q{, }, @_), "\n"; } no utf8; Dump( foo => 'bar' ); #=> 'foo'(bytes), 'bar'(bytes) no utf8; だもんで,... 続きを読む
引き続きCatalystでごにょごにょしてるんですが、(NanoAにもそろそろ戻りたい気もしてきた) hidekさんの http://blog.hide-k.net/archives/2009/01/catalyst_4.php を参考にしつつ、C::P::FV::S::Autoでフォームの検証をしようとしてエラーメッセージに日本語... 続きを読む
use strict; use warnings; use Digest::SHA1 (); use Digest::SHA (); use Perl6::Say; use Encode; my $data = '娘の大好きな番組は二人はプリキュアとお願いマイメロディです'; my $str = decode('utf8', $data); say $data; say $str; say "---"; say Diges... 続きを読む
についてを、社内用に書いたんだけど、別に社外に出しても問題ないので、ここにコピペしておきますね。flagged utf8 なセカイで生きるための100の心得入り口で decode して、内部ではすべて flagged utf8 で扱い、出口で encode する。これがすべてです!と... 続きを読む
perl, memoUTF8 フラグについてわかってるつもりだったんですが, utf8::is_utf8 considered harmful - Bulknews::Subtech - subtech を読んで混乱したので,自分なりにまとめてみました。間違いがありましたらご指摘よろしく。 まとめスカラー変数の内部表象の... 続きを読む
miyagawaさんが#catalystでいってたことやっと理解できた、きがする。 use Data::Dumper; my $s = "H\x{c3}\x{ab}llo"; utf8::decode($s); warn Dumper $s; # => "H\x{eb}llo" warn utf8::is_utf8($s) # => 1 だけれども my $s = "H\x{eb}llo"; warn utf8::is_u... 続きを読む
■ utf8::is_utf8 considered harmful 14:28 unknownplace.org - 2008/02/17 404 Blog Not Found:perl - utf8::is_utf8("¥x{ff}") == 0 弾さんの書いてるのはもちろん間違いではないのだが、ちょっと今回はなしていたのとはポイントが違っていて、 なぜこうな... 続きを読む
ちょうどいい機会なので、Perl 5.8以降におけるutf8フラグの立ち方を。 unknownplace.org - 2008/02/17 - utf8::is_utf8 ということで、"\x{6751}\x{702c}\x{5927}\x{8f14}" などというData::Dumper表記でかならずしも utf-8フラグがたつわけじゃない。というこ... 続きを読む
[Perl] JSON モジュールの utf8 フラグ周りの仕様 tips 注意点 << 作成日時 : 2008/01/07 05:21 >> トラックバック 0 / コメント 1 Perl の JSON モジュールで日本語を含む文字列を扱う際の tips。 [Perl] JSON モジュール 2.x 系は、1.x 系と互換性が△ の記... 続きを読む
最近、PerlのUTF-8関連が話題(宮川さん、Danさん、Yappoさん)だったので。 宮川さんの内容に関しては、UTF-8に限っては、use utf8 で、STDIO、STDOUTは影響しないので、問題ないんじゃないのかなぁとは思いますが。 #!/usr/bin/perl use utf8; print "あいうえ... 続きを読む
これを見て、(de|en)codeURIUnicodeがあればいいと思ったので作ってみた sawatの日記 - Unicodeエスケープなので、前述のような単に非ASCII文字をエスケープしたいだけのようなケースではUnicodeエスケープを使った方がよいです。Javaのpropertiesとかnative2as... 続きを読む
_ [言語] インド語の「あいうえお」 昔からなぜ「あ、い、う、え、お」という順番なんだろう、と不思議に思ってはいたが、 まさかインドに由来があるとは。 以下はインド方言の一つBrahmi語 インド地方のBrahmi文字の一覧。 ちょっと母音が多いがおおむね「あい... 続きを読む
■ Fix dodgy utf-8 bytes 01:44 すでに utf-8 なバイト列を latin-1 と解釈して utf-8 に二重エンコードすることで起きる文字化け(を表現する短い言葉ってないのかな)を直すコード。 ちなみにPerl では Unicode 文字列と utf-8 bytes (non UTF-8 flagged) を... 続きを読む
ようやくUTF8での運用に慣れたきがするので、どうやってUTF-8を使っているのか紹介。 EthnaでUTF-8なWebアプリを作る場合、templateをすべてUTF-8で書いてやればいいわけですが、ActionFormのValidateなどで表示されるEthna内部に書かれているエラーメッセージ... 続きを読む
Emacs 21.3 で utf8 2006-10-16-1 [Tips] Emacs 21.3 で Mule-UCS-0.84.tar.gz を入れると、 「Symbol's value as variable is void: progn」と怒られた。 そこで、 http://unit.aist.go.jp/itri/itri-gist/ftp.m17n.org/ にある pub/mule/Mule-UCS/test/Mule-U... 続きを読む
2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。 最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなけ... 続きを読む
PHP で UTF-8 に付いている BOM を削除する方法 UTF-8 に BOM (Byte Order Mark) が付くのが良いのか,悪いのかは分からないけど,問題が多そうな気がする. Windows に付いているメモ帳はご丁寧に BOM をつけてくる. - When a BOM is used, is it only in 16-... 続きを読む
Note that this guide covers the recent versions of Rails, if you are stuck with an older version take a look at the UnicodeStringsInOldRails A short intro While Ruby doesn’t have any specific facilities for managing Unicode strings, you can ... 続きを読む