タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

utf8とperlに関するkamawadaのブックマーク (4)

  • perlの波ダッシュの文字コード変換のまとめ - (゚∀゚)o彡 sasata299's blog

    2009年02月22日22:31 Perl perlの波ダッシュの文字コード変換のまとめ perlの文字コード周りはなかなかカオスです。外部エンコードとか、perl内部での文字コードとか、UTF8フラグとか。UTF8フラグ?なにそれ?な人は、こことかここを見てみると良いかも。(・∀・) 基的には外部から入ってきた時点でdecodeして、出力時にencodeしてやれば全て解決するんですが、「〜(波ダッシュ)」と「−(全角マイナス)」だけは特別です。注意が必要なのはこの2パターン。 ① utf8⇔shift_jis ② utf8⇔euc-jp ①については以前、perl utf8→sjisで文字化けという記事で紹介しましたが、encode時に、'sjis'では無くて、'cp932'を指定すればOK。※「〜」とか「−」はsjisには含まれていない文字なのが原因。 今回紹介したいのは②の場合です

  • perlunitut 和訳 - Perl Unicode Tutorial

    CPAN にあった Perl の Unicode Tutorial を和訳したものです。 ところどころ意訳であったり原文にない表現があったりします。 わかりづらい部分がありましたら原文を参照してください。 DESCRIPTION 「文字」 というものを無視していた状況は過去のものとなりました。 これまで 「日語」 や 「アクセントつきの文字」、「ユーロ記号のようなもの」 はバイトの組み合わせで表現されていましたが、これからは 「バイト列」 ではなく 「文字列」 として扱う必要がある、という事実が認められました。 つまり、プログラマは新たな習慣を身に着けなければなりません。 Unicode を扱えるソフトウェアをプログラミングするのは簡単ですが、正しくプログラムを書くためには鍛錬が必要です。 文字集合 (character sets) と文字符号化 (text encodings) につい

  • tokuhirom blog

    Blog Search when-present<#else>when-missing. (These only cover the last step of the expression; to cover the whole expression, use parenthesis: (myOptionalVar.foo)!myDefault, (myOptionalVar.foo)?? ---- ---- FTL stack trace ("~" means nesting-related): - Failed at: ${entry.path} [in template "__entry.ftlh" at line 3, column 25] - Reached through: #include "__entry.ftlh" [in template "entry.ftlh" at

    kamawada
    kamawada 2008/05/31
    「utf8.pm は「このスクリプトは utf8 で書いてあるよー」と宣言する目的以外でつかってはいけません。」<らじゃー!
  • 2006/04/10 - memo - unknownplace.org

    PACKAGE->inflate_column( query => { inflate => sub { my $u = URI->new; $u->query(shift); my $ret = {}; for my $k ( $u->query_param ) { my @v = $u->query_param($k); $ret->{$k} = @v > 1 ? [@v] : $v[0]; } $ret; }, deflate => sub { my $utf8off = sub { my $str = shift; utf8::encode($str) if utf8::is_utf8($str); }; my $hash = shift; for ( keys %$hash ) { if ( ref $hash->{$_} eq 'ARRAY' ) { $utf8off->($_

  • 1