タグ

2008年5月8日のブックマーク (6件)

  • どんぞこ日誌(2008-03-29)

    * [Perl][メモ] JSON::XSのエンコーディング/コードセット関連のフラグ 2010-04-06追記: モジュール使ってみたけど文字化けして困る〜という方はこのページよりもこちらを先に読まれることをお勧めします。 以前自分でもJSONのフラグについて簡単に説明してきましたが、JSON::XSのドキュメントにずばりENCODING/CODESET FLAG NOTESというのが加わりましたので、その要約と、せっかくだからその部分の全訳を載せます(作者了解済)。(※2008-06-11 下段に一文を追記) 1 utf8オフ(デフォルト): encodeはUnicodeなJSONを返すdecodeはUnicodeなJSONを受けとり、UnicodeなPerlデータを返す。2 utf8オン: encodeはUTF-8なJSONを返すdecodeはUTF-8なJSONを受け取り、Unic

  • ウェブリブログ:サービスは終了しました。

    「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧

    ウェブリブログ:サービスは終了しました。
  • UTF-8 フラグと戦う人へ : にぽたん研究所

    ひさびさに Blog を書いてみる。 UTF-8 フラグがどうもウザいという人向けにこんな CPAN モジュールがあるそうな。 Unicode::RecursiveDowngrade hashref とか、arrayref とか複雑な構造になった変数 (たとえば XML や RSS を XML::Simple や XML::RSS 等で parse した構造) を、構造を変えることなく、値全ての UTF-8 フラグを一括で落としたい場合にベンーリ。 こんなんして使える模様。 use strict; use XML::Simple; use Unicode::RecursiveDowngrade; use Data::Dumper; my $ref = XMLin('hoge.xml'); # includes flagged UTF-8 my $rd = Unicode::Recursi

    UTF-8 フラグと戦う人へ : にぽたん研究所
  • 404 Blog Not Found:perl - Encode 入門

    2008年04月09日01:00 カテゴリLightweight Languages perl - Encode 入門 すでにOSCONでもYAPCでも、あちこちそちこちでこの基方針に関しては話したのですが、ここ 404 Blog Not Found でも改めて。 Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改め だまってコードを書けよハゲ 入り口で decode して、内部ではすべて flagged utf8 で扱い、出口で encode する。これがすべてです!とにかくこの基方針をまもっていれば幸せになれます。ここでは、EUC-JPでエンコードされたファイル中の「小飼弾」「こがいだん」「コガイダン」「Kogai Dan」を正規表現で書き換えて標準出力にEUC-JPで出力するプログラムを例にとって説明します。 decode() then encode(

    404 Blog Not Found:perl - Encode 入門
  • XML::SimpleのXMLinで、UTF-8 flagがonになるときとならないときがあるのはなぜでしょう?→解決 - 結城浩のはてなブログ

    いつも教えてクンで申し訳ありません。PerlUTF-8 flagに詳しい方に質問です。 以下のCGIをWindowsで動かしたときと、Freebsdで動かしたときに振る舞いが変わる理由を知りたいと思っています。 sample.cgi #!/usr/bin/perl use strict; use warnings; use Encode; use Data::Dumper; use XML::Simple; my $ref = XMLin('input.xml'); print "Content-type: text/html; charset=UTF-8\n\n"; print '<pre>'; print Dumper($ref); if (utf8::is_utf8($ref->{name}->[0])) { print 'ON'; } else { print 'OFF'; }

    XML::SimpleのXMLinで、UTF-8 flagがonになるときとならないときがあるのはなぜでしょう?→解決 - 結城浩のはてなブログ
  • perl - Encode 中級 : 404 Blog Not Found

    2008年05月08日04:00 カテゴリLightweight Languages perl - Encode 中級 以前書いた 404 Blog Not Found:perl - Encode 入門 は大好評でしたが、 ウェブで利用される文字コード、UnicodeがASCIIを上回る--グーグルが明らかに:マーケティング - CNET Japan UnicodeがASCIIを追い越し、World Wide Web上で最も多く利用されている文字コード体系になったとGoogleのシニアインターナショナルソフトウェアアーキテクトMark Davis氏がブログで述べている。 という時代に完全対応するには、入門以上の知識がちょっと必要になります。 例えば、blogをホストしてくれているlivedoor blogの文字コードはEUC-JP。「時代はUnicode」だと言っても、こうした事情もまだ

    perl - Encode 中級 : 404 Blog Not Found