タグ

文字コードとRubyに関するreponのブックマーク (2)

  • String#force_encoding (Ruby 3.3 リファレンスマニュアル)

    force_encoding(encoding) -> self[permalink][rdoc][edit] 文字列の持つエンコーディング情報を指定された encoding に変えます。 このとき実際のエンコーディングは変換されず、検査もされません。 Array#pack などで得られたバイト列のエンコーディングを指定する時に使います。 [PARAM] encoding: 変更するエンコーディング情報を表す文字列か Encoding オブジェクトを指定します。 例 s = [164, 164, 164, 237, 164, 207].pack("C*") p s.encoding #=> ASCII-8BIT p s.force_encoding("EUC-JP") #=> "いろは" p s.force_encoding(Encoding::EUC_JP) #=> "いろは" u =

  • Ruby 1.9.1のm17nについてメモ - monthly gimite

    2009/2/8追記: 今はもう↓の公式ドキュメントやid:macksさんのドキュメントなどいろんな情報が出ているので、このメモの存在意義は微妙ですが、一応1.9.1に合わせて修正しておきました。 多言語化 class String class IO この辺のドキュメントが見つからず(まだない?)、いろいろ試行錯誤して分かったことをメモ。 まず、Ruby 1.9では文字列オブジェクトがそれぞれ文字コードを持っている。 p "a".encoding #=> #<Encoding:US-ASCII> ファイルの先頭に # -*- encoding: UTF-8 -*- と書いておくと、文字列リテラルのencodingがUTF-8になる。 p "あ".encoding #=> #<Encoding:UTF-8> p "a".encoding #=> #<Encoding:UTF-8> これを書か

    Ruby 1.9.1のm17nについてメモ - monthly gimite
  • 1