endorのブックマーク - はてなブックマーク

だらだら備忘録: JRubyと日本語　解析(1)
endor 2008/11/11
jruby
リンク
だらだら備忘録: JRubyと日本語　解析(2)
2007/12/31 JRubyと日本語　解析(2) とりあえず、JRubyではUTF8でソース書いて使うのが良いみたい。正規表現は/ほげ/uのようにuオプションを使えばヒットする。ここ参照 JRubyの内部はRubyStringというクラスで文字列を持っているっぽい。これはByte列で文字列をもっている。Kernel#openとかでファイルを開いたときは、Shift_JIS(Windows-31J)のファイルならばShift_JIS(Windows-31J)のバイト列で保持するし、InputStreamReaderでエンコードを指定して読み込んだとかJavaのAPI経由ならUTF-8で持っているみたい？ SJISを読んでEUCを出力するときは、Openの場合はSJISから open(ARGV[0]).each do |line| puts NKF.nkf('-eS', line) end
endor 2008/11/11
jruby
リンク
だらだら備忘録: 2007/12
endor 2008/09/02
jruby
リンク
だらだら備忘録: JRubyと日本語
2007/12/19 JRubyと日本語 JRubyでどうも日本語の処理がうまくないなぁということでちょっと調べてみた。環境はXP Proに以下 C:\test>ruby -v ruby 1.8.6 (2007-03-13 patchlevel 0) [i386-mswin32] C:\test>jruby -v ruby 1.8.5 (2007-12-15 rev 5200) [x86-jruby1.0.3] (1)スクリプトに日本語を直接書いたとき（Shift_JISで保存）。 puts "こんにちは、JRuby!" puts "①" puts '十' puts "～" Rubyは-Ksオプションをつければ動くけど、JRubyはエラーになる。 :1: sjis.rb:3: Invalid char `\201' in expression (SyntaxError) 「十」の2バイト
endor 2008/08/28
jruby
リンク
1

はてなブックマーク

タグ

ブックマーク / blog.memo.vg (4)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / blog.memo.vg (4)

だらだら備忘録: JRubyと日本語 解析(1)

だらだら備忘録: JRubyと日本語 解析(2)

だらだら備忘録: 2007/12

だらだら備忘録: JRubyと日本語

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

だらだら備忘録: JRubyと日本語　解析(1)

だらだら備忘録: JRubyと日本語　解析(2)