タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

EncodingとPerlに関するagwのブックマーク (2)

  • Text::CSV は日本語入ってるとダメなんだ、、、orz

    Text::CSV で parse したらエラー出まくりだったので、エラーになってる CSVのファイルをのぞくと日語の行がエラーになっていた、、、orz どうやら、日語入っているとダメみたい、、っで、検索してみたら「勝手に添削 - PerlによるCSVファイルの高速集計 2 - 404 Blog Not Found」で、Text::CSV_XS で、{binary=>1} のオプションを付けると、どうやら日語混じりでも OK らしいので、さっそくインストールしてコードを修正。モジュール名の変更だけで済んだ。 use strict; use warnings; use Text::CSV_XS; $| = 1; my $file = './hoge.csv'; my $csv = Text::CSV_XS->new({binary=>1}); open my $fh, '<', $fi

  • Time to ditch encoding.pm: blog.bulknews.net

    Time to ditch encoding.pm Perl でソースコードにマルチバイトなリテラルを埋め込む場合には encoding プラグマを使うのが定石でしたが、 use encoding 'utf-8'; my $name = "宮川達彦"; こうすると STDIO まで utf-8 でエンコード・デコードされるという問題があり、また encoding.pm はファイルスコープで動くのでレキシカルに一部分だけバイト列として扱いたい(という需要があるかどうかは微妙ですが)というときにうまくいかず、イマイチ encoding プラグマを全面採用できず、decode() を使ったり \x{XXXX} で書いたりってことが結構ありました。 が、Juerd と RGARCIA が encoding::source と encoding::stdio (もとは encoding::split

  • 1