[B! 文字コード] kiryuuのブックマーク

kiryuu id:kiryuu

文字コードに関するkiryuuのブックマーク (7)

perl - Encode 中級 : 404 Blog Not Found
2008年05月08日04:00 カテゴリLightweight Languages perl - Encode 中級以前書いた 404 Blog Not Found:perl - Encode 入門は大好評でしたが、ウェブで利用される文字コード、UnicodeがASCIIを上回る--グーグルが明らかに:マーケティング - CNET Japan UnicodeがASCIIを追い越し、World Wide Web上で最も多く利用されている文字コード体系になったとGoogleのシニアインターナショナルソフトウェアアーキテクトMark Davis氏がブログで述べている。という時代に完全対応するには、入門以上の知識がちょっと必要になります。例えば、本 blogをホストしてくれているlivedoor blogの文字コードはEUC-JP。「時代はUnicode」だと言っても、こうした事情もまだ
kiryuu 2009/10/21
「UTF-8で書かれたTextをEUC-JPに変換し、変換しきれないものは実体参照に」

encode

perl

unicode

utf-8

文字コード

utf8
リンク
404 Blog Not Found:perl - Encode 入門
2008年04月09日01:00 カテゴリLightweight Languages perl - Encode 入門すでにOSCONでもYAPCでも、あちこちそちこちでこの基本方針に関しては話したのですが、ここ 404 Blog Not Found でも改めて。 Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改めだまってコードを書けよハゲ入り口で decode して、内部ではすべて flagged utf8 で扱い、出口で encode する。これがすべてです！とにかくこの基本方針をまもっていれば幸せになれます。ここでは、EUC-JPでエンコードされたファイル中の「小飼弾」「こがいだん」「コガイダン」「Kogai Dan」を正規表現で書き換えて標準出力にEUC-JPで出力するプログラムを例にとって説明します。 decode() then encode(
kiryuu 2009/02/18
PerlIOとかbinmodeとか、文字コードの扱い。参考になる……というかDan KogaiさんとこのBlog

perl

unicode

utf8

文字コード
リンク
[Perl] Encode Jcode UnicodeJapanese のベンチマーク比較 isoya9の日記-ウェブリブログ
「ウェブリブログ」は 2023年1月31日をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧
kiryuu 2008/10/24
Encode.pmで半角カナを変換するには、Encode::JP::H2Z

perl

文字コード
リンク
Perl Encode - PukiWiki
http://www.pure.ne.jp/~learner/program/Perl_unicode.html Perl 5.8.x Unicode関連目次 Perl 関連・Perl 変数について・Perl Tips ・Perlオブジェクト指向プログラミング・Perl 5.8.x Unicode 関連・Perl(とか)の書籍 > 趣旨と注意書き > UTF8フラグ？ > UTF8フラグとPerlIOレイヤ > UTF8フラグのついた文字列を記述する > Wide character in print ... > Encode > utf8::* > use utf8; > use encoding; > use UTF8 と use encoding > JcodeからEncodeへ > 情報源 - モドル趣旨と注意書き Perl 5.8.x のUnicode 関連です。正
kiryuu 2008/08/24
utf

unicode

utf-8

エンコード

文字コード
リンク
UTF-8 フラグと戦う人へ : にぽたん研究所
ひさびさに Blog を書いてみる。 UTF-8 フラグがどうもウザいという人向けにこんな CPAN モジュールがあるそうな。 Unicode::RecursiveDowngrade hashref とか、arrayref とか複雑な構造になった変数 (たとえば XML や RSS を XML::Simple や XML::RSS 等で parse した構造) を、構造を変えることなく、値全ての UTF-8 フラグを一括で落としたい場合にﾍﾞﾝｰﾘ。こんなんして使える模様。 use strict; use XML::Simple; use Unicode::RecursiveDowngrade; use Data::Dumper; my $ref = XMLin('hoge.xml'); # includes flagged UTF-8 my $rd = Unicode::Recursi
kiryuu 2008/08/24
perl

unicode

utf-8

utf8

文字コード
リンク
Perl 5.8.x 以降で BOM を操作するモジュール
Perl では Unicode のファイルを読み込んでも自動的にBOMを削ってくれない。過去に自分でも削ってくれるプログラムも書いた。 (「Perl 5.8.x で BOM を扱う」を参照) 最近、File::BOM というモジュールをCPANで発見した。いつのまにか、ActiveState のPPMのサイトにもアップロードされていた（つまり、バンドルされていないが、CPAN File::BOM で ActivePerl 5.10.0なら ppm install File::BOM とかでインストールできるということ)。何通りかの使い方がある。ファイルを読み込んだとき、Encoding を知りたいのであれば、bom_open 関数が使える。ちなみにこんな感じになる。 use utf8; use open ":encoding(cp932)",":std"; use File::BOM
kiryuu 2008/07/11
Perl

Unicode

BOM

文字コード
リンク
Encode::Guess - 文字コードの判別
[Perl] Encode::Guessモジュールは文字コードの判別に使用されます。ただし判別結果が複数になることがあるので注意。 #まず候補となる文字コードを指定します。utf-8は最初から候補に入っているので不要
kiryuu 2008/06/13
Encode::Guessを使った文字コードの判別方法

Perl

文字コード
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx