こんにちは!ラブプラスとときメモ4の狭間で揺れ動いているxaicronです!! 今日は日本でプログラムを書いていたら避けては通れない気がする、Encodeの話をしようと思います! はじめに まず、この記事を読む前に、Perlのバージョンの確認をしてください。以下... 続きを読む
まあ見落とした私が悪いんだし、水曜日の晩は勉強会系の誘いがそれ以外にも3本あって、そのうち滅多に開催されない一つに出たのだけれども、これを知っていればそちらを優先したのに。 率直に申し上げて、諸君の誰よりもこの問題に時間を割いてきて、またこの問... 続きを読む
The requested blog was not found on this server -- unless you requested that of Dan Kogai (小飼 弾). 結論だけ言ってしまえば、Perlなら以下の原則を守るだけです。 404 Blog Not Found:perl - Encode 入門 すでにOSCONでもYAPCでも、あちこちそちこちで... 続きを読む
perl 5.8.7 以前かつ Encode のバージョンアップできねーみたいな環境でも互換性を保ちながら書けるように。 use Encode; use Encode::compat::MIME::Header::ISO_2022_JP; my $subject = encode('MIME-Header-ISO_2022_JP', '日本語の件名'); みたいな感じ。コ... 続きを読む
いつも思うんですが、WikipediaのURLって長いですよね。%E3%83…って、意味不明な文字列が延々と続いて、見づらいです。はてなキーワードとか日本語の辞書的サイトは、みんなそんな感じです。 というわけで、メールや掲示板にURLを書いたときに、少しでも途中で... 続きを読む
以前書いた 404 Blog Not Found:perl - Encode 入門 は大好評でしたが、 ウェブで利用される文字コード、UnicodeがASCIIを上回る--グーグルが明らかに:マーケティング - CNET JapanUnicodeがASCIIを追い越し、World Wide Web上で最も多く利用されている文字コー... 続きを読む
すでにOSCONでもYAPCでも、あちこちそちこちでこの基本方針に関しては話したのですが、ここ 404 Blog Not Found でも改めて。 Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改め だまってコードを書けよハゲ入り口で decode して、内部ではすべて fl... 続きを読む
ISO 646 の 多バイト拡張 これまでよく使われてきた、SJIS, ISO-2202-JP, EUC-JP について。 コード範囲 +------+------------------+------+------------------+ | 0 1 | 2 3 4 5 6 7 | 8 9 | A B C D E F | +------+------------------+------+--------------... 続きを読む
うーん、これ、かなり5.8 portersの想定の範囲外の使われ方だったのですね。 Time to ditch encoding.pm: blog.bulknews.netPerl でソースコードにマルチバイトなリテラルを埋め込む場合には encoding プラグマを使うのが定石でしたが、 元々、encodingプラグマ... 続きを読む
はっきり言ってこれはフェアではない。 みかログ: ErlangとPerlの速度比較Perl側は,Encodeが遅い. Encode::from_toがinplaceでコンバートしてしまうために,直前に文字列コピーがあるのも影響しているのかも なぜなら、Encode::from_to()は速度ではなく、安全... 続きを読む