2007/12/31 JRubyと日本語 解析(2) とりあえず、JRubyではUTF8でソース書いて使うのが良いみたい。正規表現は/ほげ/uのようにuオプションを使えばヒットする。ここ参照 JRubyの内部はRubyStringというクラスで文字列を持っているっぽい。これはByte列で文字列をもっている。Kernel#openとかでファイルを開いたときは、Shift_JIS(Windows-31J)のファイルならばShift_JIS(Windows-31J)のバイト列で保持するし、InputStreamReaderでエンコードを指定して読み込んだとかJavaのAPI経由ならUTF-8で持っているみたい? SJISを読んでEUCを出力するときは、Openの場合はSJISから open(ARGV[0]).each do |line| puts NKF.nkf('-eS', line) end
2007/12/19 JRubyと日本語 JRubyでどうも日本語の処理がうまくないなぁということでちょっと調べてみた。 環境はXP Proに以下 C:\test>ruby -v ruby 1.8.6 (2007-03-13 patchlevel 0) [i386-mswin32] C:\test>jruby -v ruby 1.8.5 (2007-12-15 rev 5200) [x86-jruby1.0.3] (1)スクリプトに日本語を直接書いたとき(Shift_JISで保存)。 puts "こんにちは、JRuby!" puts "①" puts '十' puts "~" Rubyは-Ksオプションをつければ動くけど、JRubyはエラーになる。 :1: sjis.rb:3: Invalid char `\201' in expression (SyntaxError) 「十」の2バイト
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く