タグ

文字コードに関するdaaaaaaiのブックマーク (2)

  • 日本語のe-mail、ISO-2022-JP以外のcharsetを使うのは是か非か | スラド IT

    問題をよく考えましょう. 単独で動作するアプリケーションの話ではなく,不特定多数の相手との通信アプリケーション 直接に相手の(文字コードなどの)能力仕様を確認する手順を踏まずに, 仮定(相手が ISO-2022-JP 等を処理できると決めうち)の上でいきなり送りつける (SMTPによる MTA 間のやり取りはEHLO 等で仕様確認して調整する余地があるが, MUA間のやり取りは RFC822,RFC2822,RFC5322 などの仕様で書かれたものを,完全一方通行で送る) (とりあえず 8bit through かどうかはまた別の問題ということで置いておく) さてここで,歴史的に考えるとこんな感じになります. 原始時代: 英語? ローマ字?(私はよく知らない) pre-MIME時代: メッセージには JIS(≒ISO-2022-JP)を使うという プロトコル外の「共通の了解事項」を設定する

    daaaaaai
    daaaaaai 2018/01/09
    メールの文字コード難しい。絵文字扱いたいしそろそろUTF8にしてみよかな。。
  • 文字コードの変換方法まとめ 〜Rubyで文字化けした時の対応方法 - 久保清隆のブログ

    Ruby(1.8.6)で文字コードを変換したかった。 Rubyで文字コードを変換するには、 kconvを利用する方法 nkfを利用する方法 iconvを利用する方法 の3つがある。 csvダウンロードするために、utf-8をsjisに変換する必要があった。 kconvを用いる方法 Kconvは自動的に、MIMEをデコードしたり、半角カタカナを全角カタカナに変換したりする。 このような動作を好まない場合は、NKF モジュールを直接用いる必要がある。 ちなみに、Kconvは内部ではNKFを用いて変換を行っている。 kconvを使うのが一番手軽そうだったので、 コントローラでrequire 'kconv'して、 kconvのtosjisを使ってたら基的にうまくいってたんだけど、 國とか學とかの旧字体の変換で文字化けした。 require 'kconv' '学'.tosjis #=> '学' '

    daaaaaai
    daaaaaai 2012/07/19
    nkfは1.9でも使えた。元の文字コードがわかってればnkfが簡単そう。
  • 1