[B! script][Perl] wkbyshnbtkのブックマーク

wkbyshnbtk id:wkbyshnbtk

scriptとPerlに関するwkbyshnbtkのブックマーク (2)

utf-8 文字の正体を調べるスクリプト - ホワイト日記
ウェブログ記事を収集していると，意図しない文字が混入してしまい，文字化けしてしまうことがあります．そうした文字化けの原因を探るためのPerlスクリプトを書いてみました． #!/usr/local/bin/perl use Data::Dumper; use Unicode::UCD qw/charinfo charblock/; my $file = shift; # ファイル名を引数に取る my $text; { local $/; open(IN, "<:utf8", $file); # 入力ファイルはUTF-8とする $text = <IN>; close(IN); } my $len = length($text); # 1文字ずつループさせる for(my $i = 0; $i < $len; $i++) { my $char = substr($text, $i, 1);
wkbyshnbtk 2006/11/13
encode

unicode

perl

script

coding
リンク
自分の名前を調べる＠のぶろぐ
wkbyshnbtk 2006/10/11
CGI

Perl

script

dir

links

拡張子

regexp

env
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx