Engadget JapaneseというサイトのHTMLに書いてある日本語を euc-jp とか utf-8 にしたいのだけど、方法がわかりません。 ここのサイトのHTMLの meta を見ると charset="iso-8859-1" だということがわかります。ふむふむと思って見てみてもエンティティになっているっぽく「格安」こんな感じになっています。実際これをHTMLで書くと下記のようになります。 「格安」(←実際にはHTML内で「格安」こう書いてます) このように「格安」とブラウザ上には表示されます。。。うーむ。どうやってこのエンティティをeuc-jpやutf8にするのかと小一時間。 use Encode; use HTML::Entities; print decode('iso-8859-1', decode_entities