NAME Encode::JIS2K - JIS X 0212 (aka JIS 2000) Encodings SYNOPSIS use Encode::JIS2K; use Encode qw/encode decode/; $euc_2k = encode("euc-jisx0213", $utf8); $utf8 = decode("euc-jisx0213", $euc_jp); ABSTRACT This module implements encodings that covers JIS X 0213 charset (AKA JIS 2000, hence the module name). Encodings supported are as follows. Canonical Alias Description ---------------------------
NAME Data::Visitor::Encode - Encode/Decode Values In A Structure (DEPRECATED) SYNOPSIS # THIS MODULE IS NOW DEPRECATED. Use Data::Recursive::Encode instead use Data::Visitor::Encode; my $dev = Data::Visitor::Encode->new(); my %hash = (...); # assume data is in Perl native Unicode $dev->encode('euc-jp', \%hash); # now strings are in euc-jp $dev->decode('euc-jp', \%hash); # now strings are back in u
とします。Perl で文字コードを操作する方法は、Encode.pm と旧Jcode.pm (0.8系)がメジャーどころなので、その2つについて調査しました。Encode.pm に関しては、Encode::JP と Encode::JIS2K を対象としました。 まず結論から。Encode::JIS2K を使う限り、文字化けする SJIS コードは以下の35文字です。 JIS2004 で追加された10文字:879F 889E 9873 989E EAA5 EFF8 EFF9 EFFA EFFB EFFC カ行に半濁音(゜)を付けた文字など一部の文字: 82f5 82f6 82f7 82f8 82f9 8397 8398 8399 839a 839b 839c 839d 839e 83f6 8663 8667 8668 8669 866a 866b 866c 866d 866e 8685 8
NAME Template::Stash::ForceUTF8 - Force UTF-8 (Unicode) flag on stash variables SYNOPSIS use Template::Stash::ForceUTF8; use Template; my $tt = Template->new( LOAD_TEMPLATES => [ Template::Provider::Encoding->new ], STASH => Template::Stash::ForceUTF8->new, ); my $vars; $vars->{foo} = "\x{5bae}\x{5ddd}"; # Unicode flagged $vars->{bar} = "\xe5\xae\xae\xe5\xb7\x9d"; # UTF-8 bytes $tt->process($templ
Encode::First is now going to CPAN, or can be downloaded from my svn repo: http://svn.bulknews.net/repos/public/Encode-First/trunk/Thanks to Juerd and Aristotle for valuable feedbacks.Meanwhile I found another bug in Encode::JP::JIS7, which encodes all un-encodable characters into PERLQQ format, when we specify "iso-2022-jp" as an encoding. This is a serious bug and reported to Dan and on perl-uni
標準添付ライブラリ紹介 〜Encode〜 書いた人: Ktat 標準添付ライブラリ紹介 〜Encode〜 はじめに この連載について Perlの文字コード変換の経緯 jcode.pl Jcode Encode Encode の前に UTF8 フラグ付き文字列 Perl の内部表現 (internal representation) ソースに書かれた文字列は? Encode Encode::encode Encode::decode Encode::from_to エラーハンドリング Encode::FB_DEFAULT( == 0) Encode::FB_CROAK( == 1) Encode::FB_QUIET Encode::FB_WARN コードリファレンス Encode::Guess 文字コードの推測 Encodeの関数の引数に "Guess" を与える guess_encodin
2007年01月11日21:00 カテゴリLightweight Languages ruby|perl - 文字コードのちょっと高度な判定 これははっきり言って悩ましい。ですが、判定が曖昧な場合はその旨をきちんと通知するのがBetter Practiceではないかと思います。 Matzにっき(2007-01-03) 手元のcalkiがUTF-8の「》」相当の文字(U+8BB)を含むエントリが文字化けするので、 nkf-utf8のソースを見てみた。 どうも自動判定の優先順位がEUC-JP,SJIS,JIS,UTF-8で固定されていて、 EUCの範囲内に収まる文字列はすべてEUC-JPとみなすことになっている。 で、UTF-8の「》」はEUC-JPの「損」と同じバイト列なのだ。例えば、以下を行ごとにコード判定すると、以下のような結果になります。 son.utf8 » 損 »損 »Son nk
Dan Kogai Alex Davies Alex Kapranoff Alex Vandiver Andreas J. Koenig Andrew Pennebaker Andy Grundman Anton Tagunov Autrijus Tang Benjamin Goldberg Bjoern Hoehrmann Bjoern Jacke bulk88 Craig A. Berry Curtis Jewell Dave Evans David Golden David Steinbrunner Deng Liu Dominic Dunlop drry Elizabeth Mattijsen Flavio Poletti Gerrit P. Haase Gisle Aas Graham Barr Graham Knop Graham Ollis Gurusamy Sarathy
はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28
「D-5 出張版:機種依存文字入りのShiftJISを扱う」を読んで大変タイムリーだったので実験して見ました。 はてぶのコメントでmiyagawaさんが decode("cp932", $buf) でいい気が とおっしゃられているので こんなんで実験してみました。 JISやEUCを取り扱うのでEncode::Unicode::Japanseを使って見ました。 取り扱うtext.txtは機種依存文字や半角カタカナを含んだこんなファイル。 #!/usr/bin/perl use strict; use warnings; use Encode::Unicode::Japanese; use Encode qw/encode decode/; _encode (qw/text.txt shift_jis sjis-utf8.txt utf8/); _encode (qw/text.txt shi
hide-k.net#blog: C::P::Email::Japaneseの文字化け対処 でWAVE DASH問題に何とか対応しようとしてMIME::TT::Lite::Japaneseに手を加えるというトンチンカンなことをやっていましたが、subtech - Bulknews::Subtech - cp932 vs. shift_jisでEncode::Aliasを使えばいいんじゃないかというお話があったのでEncode::Unicode::Japaneseとからめて試してみました。 sub send : Private { use Encode::Alias; use Encode::Unicode::Japanese; define_alias( qr/jis$/i => '"unijp-jis"' ); $c->email( Template => 'email.tt', To
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く