さて、jruby での nokogiri チュートリアルの勝手なまとめ の第4回目です。 前にも書きましたように、jruby 1.5.6 は cruby1.8.7 とほぼ同等ですが、マルチバイト文字の扱いはまったく同じではありません。私は cruby1.8.7 での動作の検証はやってません。 nokogiri のバージョンは 1.4.4.2 です。 ubuntu10.04 を使用していますので、文字環境は utf-8 がデフォです。 ●HTML / XMLのドキュメント の内容を変更する このような HTMLドキュメントがあるとする。 $KCODE = 'UTF8' require 'rubygems' require 'nokogiri' @doc = Nokogiri::HTML::DocumentFragment.parse <<-EOHTML <body> <h1>Three's