タグ

perlと文字コードに関するpaselaのブックマーク (5)

  • 第33回 enc2xs:標準の文字コード表にはない文字を変換する | gihyo.jp

    Encodeを使っても文字化けするとき Encodeは特定のエンコーディングにしたがって配列されたバイナリを「文字列」に置き換えるためのモジュールですが、かならずしもすべてのエンコーディングがあらゆるバイナリの組み合わせに対応しているわけではありません。 たとえば、「⁠シフトJIS」環境における機種依存文字の例としてよく取り上げられる丸付き数字をEncodeのお作法通りにdecode、encodeする場合、「⁠シフトJIS」だからと思って安易にshiftjis系列のエンコーディングでdecodeしてしまうと、丸付き数字のマッピングデータがないため「?@」のように文字化けを起こしてしまいます。 use strict; use warnings; use Encode; my $binary = pack('C*', 0x87, 0x40); # ①; my $string = decode(

    第33回 enc2xs:標準の文字コード表にはない文字を変換する | gihyo.jp
  • perl - use encoding; #は黒歴史 : 404 Blog Not Found

    2009年06月08日14:30 カテゴリLightweight Languages perl - use encoding; #は黒歴史 ぎゃあぁぁ length関数で文字列の長さを求める - perl初心者BLOG - Hatena::Group::Perl語の文字数を正確に求めたい場合、use encodingを指定する use encoding;は、jperlなど、かつて存在したL10Nされたperl用に書かれたレガシースクリプトを、モダンperlで動かすときのためのおまじないです。こういう目的で利用すべきではありません。 このあたりのことは、以前 404 Blog Not Found:perl - no encoding; # whenever possible でも書いたのですが、大事なことなのでまた書きます。 スクリプトはUTF-8で書き、use utf8;する のがモ

    perl - use encoding; #は黒歴史 : 404 Blog Not Found
  • perl - EncodeでXSSを防ぐ : 404 Blog Not Found

    2009年03月03日19:00 カテゴリLightweight Languages perl - EncodeでXSSを防ぐ 良記事。 第7回■文字エンコーディングが生み出すぜい弱性を知る:ITpro だけど、問題点のみ具体例があって、対策にないのが片手落ちに感じられたので、その点を補足。 結論だけ言ってしまえば、Perlなら以下の原則を守るだけです。 404 Blog Not Found:perl - Encode 入門 すでにOSCONでもYAPCでも、あちこちそちこちでこの基方針に関しては話したのですが、ここ 404 Blog Not Found でも改めて。 Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改め だまってコードを書けよハゲ入り口で decode して、内部ではすべて flagged utf8 で扱い、出口で encode する。これが

    perl - EncodeでXSSを防ぐ : 404 Blog Not Found
  • Windows環境でShift_JISなファイル名をPath::Class使って問題なく操作する方法 - Unknown::Programming

    ちょっとした野暮プログラムで、あるフォルダのファイル名の抽出を行おうと思ったんだ。 ほんと軽い気持ちで、そう軽い気持ちでちょこちょこっとさ。 use Path::Class; use Perl6::Say; for my $file ( dir('./hoge')->children ) { say $file->basename; } こんなのね。すごいシンプル。ちょうシンプル。コレでhogeフォルダ以下のファイルを取得できるのね。 で、動かしてみたの。もちろん云わずもかなWindows環境ね。Windows環境。 するとね。うまくファイル名が抽出できなかったのさ。 そう、よくあることだ。Shift_JISだよShift_JIS。Shift_JISのせいなんだ。ファイル名にShift_JISが含まれてるの。 Shift_JISの「予」や「表」とかの文字コードは2バイト目がバックスラッシュ

    Windows環境でShift_JISなファイル名をPath::Class使って問題なく操作する方法 - Unknown::Programming
  • 今日のCPANモジュール(跡地) 目次

    Redirecting… Click here if you are not redirected.

  • 1