エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
だらだら備忘録: JRubyと日本語 解析(2)
2007/12/31 JRubyと日本語 解析(2) とりあえず、JRubyではUTF8でソース書いて使うのが良いみたい。正規... 2007/12/31 JRubyと日本語 解析(2) とりあえず、JRubyではUTF8でソース書いて使うのが良いみたい。正規表現は/ほげ/uのようにuオプションを使えばヒットする。ここ参照 JRubyの内部はRubyStringというクラスで文字列を持っているっぽい。これはByte列で文字列をもっている。Kernel#openとかでファイルを開いたときは、Shift_JIS(Windows-31J)のファイルならばShift_JIS(Windows-31J)のバイト列で保持するし、InputStreamReaderでエンコードを指定して読み込んだとかJavaのAPI経由ならUTF-8で持っているみたい? SJISを読んでEUCを出力するときは、Openの場合はSJISから open(ARGV[0]).each do |line| puts NKF.nkf('-eS', line) end