
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Ruby : Nokogiriはバイナリモードで読んだhtmlの文字コードを自動で判別しにいく - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Ruby : Nokogiriはバイナリモードで読んだhtmlの文字コードを自動で判別しにいく - Qiita
はじめに open-uriでhtmlを読み込み、Nokogiriでパースしてスクレイピングを行っていたのですが、その際... はじめに open-uriでhtmlを読み込み、Nokogiriでパースしてスクレイピングを行っていたのですが、その際Nokogiriのエンコーディングをnilに(もしくは省略)しても文字化けを起こすことなくパースができていました。 open-uriでhtmlを読むときはバイナリで読み込まれるので、バイナリで読み込まれたhtmlを、エンコーディングnilにしてNokogiriでパースするとどうなるか、ということに焦点をしぼって検証してみました。 HTML.parseのエンコーディングを「nil」にしてみる Nokogiriでhtmlをパースするときのエンコーディングをnilとしてみます。HTML.parseの第三引数にnilを設定します。 今回読み込むのは以下のhtmlです。ファイルはShift_JISで書かれています。