エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
utf-8 文字の正体を調べるスクリプト - ホワイト日記
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
utf-8 文字の正体を調べるスクリプト - ホワイト日記
ウェブログ記事を収集していると,意図しない文字が 混入してしまい,文字化けしてしまうことがあります... ウェブログ記事を収集していると,意図しない文字が 混入してしまい,文字化けしてしまうことがあります. そうした文字化けの原因を探るためのPerlスクリプトを 書いてみました. #!/usr/local/bin/perl use Data::Dumper; use Unicode::UCD qw/charinfo charblock/; my $file = shift; # ファイル名を引数に取る my $text; { local $/; open(IN, "<:utf8", $file); # 入力ファイルはUTF-8とする $text = <IN>; close(IN); } my $len = length($text); # 1文字ずつループさせる for(my $i = 0; $i < $len; $i++) { my $char = substr($text, $i, 1);