NAME Template::Stash::ForceUTF8 - Force UTF-8 (Unicode) flag on stash variables SYNOPSIS use Template::Stash::ForceUTF8; use Template; my $tt = Template->new( LOAD_TEMPLATES => [ Template::Provider::Encoding->new ], STASH => Template::Stash::ForceUTF8->new, ); my $vars; $vars->{foo} = "\x{5bae}\x{5ddd}"; # Unicode flagged $vars->{bar} = "\xe5\xae\xae\xe5\xb7\x9d"; # UTF-8 bytes $tt->process($templ
Encode::First is now going to CPAN, or can be downloaded from my svn repo: http://svn.bulknews.net/repos/public/Encode-First/trunk/Thanks to Juerd and Aristotle for valuable feedbacks.Meanwhile I found another bug in Encode::JP::JIS7, which encodes all un-encodable characters into PERLQQ format, when we specify "iso-2022-jp" as an encoding. This is a serious bug and reported to Dan and on perl-uni
yamaokaです。 PHPで日本語を扱う場合、mbstringモジュールを利用する場合が多いと思います。 日本語に特有の機能(カタカナの全角/半角変換など)も備わっていて、とても便利です。 しかし、日本以外ではmbstringモジュールはあまり利用されていないようです。 代わりに利用されているのがiconvモジュールで、 最近話題のフレームワーク、symfonyでも 国際化の機能を実現するために内部で利用されています。 iconvモジュールはPHP 5でPHPの本体に組み込まれました。 別途用意して組み込む必要があるmbstringモジュールと違って、最初から使用できるので便利ですね。 PHPのマニュアルのiconv関数のページを見ると、 いくつかの関数が定義されているのがわかります。 それぞれ、mbstring関数との 対応表を作ってみました。 iconv関数mbstring関数
半角カナを通したかったので、ちょっといじった。 Index: lib/mobile_controller.rb =================================================================== --- lib/mobile_controller.rb (リビジョン 8) +++ lib/mobile_controller.rb (作業コピー) @@ -20,7 +20,7 @@ case value when String value = value.to_emoji_with_internal_encode :from => emoji_type - hash[key] = NKF.nkf('-Sw -m0', value) + hash[key] = NKF.nkf('-Sw -x -m0', value) when Hash en
標準添付ライブラリ紹介 〜Encode〜 書いた人: Ktat 標準添付ライブラリ紹介 〜Encode〜 はじめに この連載について Perlの文字コード変換の経緯 jcode.pl Jcode Encode Encode の前に UTF8 フラグ付き文字列 Perl の内部表現 (internal representation) ソースに書かれた文字列は? Encode Encode::encode Encode::decode Encode::from_to エラーハンドリング Encode::FB_DEFAULT( == 0) Encode::FB_CROAK( == 1) Encode::FB_QUIET Encode::FB_WARN コードリファレンス Encode::Guess 文字コードの推測 Encodeの関数の引数に "Guess" を与える guess_encodin
2007年01月11日21:00 カテゴリLightweight Languages ruby|perl - 文字コードのちょっと高度な判定 これははっきり言って悩ましい。ですが、判定が曖昧な場合はその旨をきちんと通知するのがBetter Practiceではないかと思います。 Matzにっき(2007-01-03) 手元のcalkiがUTF-8の「》」相当の文字(U+8BB)を含むエントリが文字化けするので、 nkf-utf8のソースを見てみた。 どうも自動判定の優先順位がEUC-JP,SJIS,JIS,UTF-8で固定されていて、 EUCの範囲内に収まる文字列はすべてEUC-JPとみなすことになっている。 で、UTF-8の「》」はEUC-JPの「損」と同じバイト列なのだ。例えば、以下を行ごとにコード判定すると、以下のような結果になります。 son.utf8 » 損 »損 »Son nk
Dan Kogai Alex Davies Alex Kapranoff Alex Vandiver Andreas J. Koenig Andrew Pennebaker Andy Grundman Anton Tagunov Autrijus Tang Benjamin Goldberg Bjoern Hoehrmann Bjoern Jacke bulk88 Craig A. Berry Curtis Jewell Dave Evans David Golden David Steinbrunner Deng Liu Dominic Dunlop drry Elizabeth Mattijsen Flavio Poletti Gerrit P. Haase Gisle Aas Graham Barr Graham Knop Graham Ollis Gurusamy Sarathy
はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28
「D-5 出張版:機種依存文字入りのShiftJISを扱う」を読んで大変タイムリーだったので実験して見ました。 はてぶのコメントでmiyagawaさんが decode("cp932", $buf) でいい気が とおっしゃられているので こんなんで実験してみました。 JISやEUCを取り扱うのでEncode::Unicode::Japanseを使って見ました。 取り扱うtext.txtは機種依存文字や半角カタカナを含んだこんなファイル。 #!/usr/bin/perl use strict; use warnings; use Encode::Unicode::Japanese; use Encode qw/encode decode/; _encode (qw/text.txt shift_jis sjis-utf8.txt utf8/); _encode (qw/text.txt shi
hide-k.net#blog: C::P::Email::Japaneseの文字化け対処 でWAVE DASH問題に何とか対応しようとしてMIME::TT::Lite::Japaneseに手を加えるというトンチンカンなことをやっていましたが、subtech - Bulknews::Subtech - cp932 vs. shift_jisでEncode::Aliasを使えばいいんじゃないかというお話があったのでEncode::Unicode::Japaneseとからめて試してみました。 sub send : Private { use Encode::Alias; use Encode::Unicode::Japanese; define_alias( qr/jis$/i => '"unijp-jis"' ); $c->email( Template => 'email.tt', To
mysql> status; -------------- mysql Ver 14.7 Distrib 4.1.20, for redhat-linux-gnu (i386) using readline 4.3 Connection id: 36 Current database: staff2006 Current user: maiha@localhost SSL: Not in use Current pager: lv Using outfile: '' Using delimiter: ; Server version: 4.1.20 Protocol version: 10 Connection: Localhost via UNIX socket Server characterset: latin1 Db characterset: latin1 Client char
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く