結論。iso-8859-1は、日本語の文字コードではありません よって、日本語への文字コード変換をしようとしても失敗します rubyでファイルからcharset(文字セット)を自動取得した場合に、Windows文字コード(CP932)のページを誤って「ISO8859−1」と解釈することがあるようです その為、以下のような一文(6行目)を入れて、読み替えを行いましょう。 charset=nil html=open(url) do |f| charset = f.charset f.read end charset="CP932" if charset=="iso-8859-1" doc = Nokogiri::HTML.parse(html,nil,charset) NOKOGIRIでテキストが取得できない 言いたいことは、概ね↑で言い切ったのですが、一応経緯も残しておきます 演劇感想文リン
![[ruby]文字コード「iso-8859-1」をUTF8にうまく変換できないときの対応方法 | 演劇とかの感想文ブログ](https://cdn-ak-scissors.b.st-hatena.com/image/square/51c3a6c1e5cba6b553045cba629b89e608970ca6/height=288;version=1;width=512/https%3A%2F%2Fblog.kansolink.com%2Fwp-content%2Fuploads%2F2018%2F03%2Fface_shout.png)