HTML Numeric character references リンクされて気付いたのですが、Perlで文字列をHTML数値文字参照に変換とは逆の、数値文字参照を文字列に変換する方法が述べられてました。しかしこの方法だと動作がややオーバーになるような気がします。 perl -MEncode -p -i -e ' s/\&#(x)?([a-f0-9]{1,5});/ my $tmpstr = ($1) ? pack( "H*", sprintf( "%08s", "$2" ) ) : pack( "N*", $2 ); Encode::encode( "iso-2022-jp", Encode::decode( "UTF-32BE", $tmpstr ) ); /eig; ' < engadget.xml 焼 とか 焼 のような文字参照からUnicodeのコー