タグ

ブックマーク / naruse.hateblo.jp (3)

  • Ruby 1.9 で絵文字変換 - なるせにっき

    浅草 jpmobile 会議 なる場で、Ruby 1.9 で絵文字変換したいときはどうすることになるのか説明せよというので、資料として書く。 利用者側がどう使うかは Ruby M17N の設計と実装 や るりま の String#encode や Encoding、Encoding::Converter クラスあたりを見てください。 で、実装の話です。 Encoding を司るのは encoding.c 各Encoding の体は enc/*.c 変換器を司るのは transcode.c 各変換器の体は enc/trans/*.trans 各変換テーブルは enc/trans/*-tbl.rb つまり、 各ケータイ文字コードに対応する encoding のファイルを作る (実は CP932 や UTF-8 のレプリカで良い (ENC_REPLICATE)) それぞれの encoding

    Ruby 1.9 で絵文字変換 - なるせにっき
  • いつ誰がEUCを作ったか 2009-03-08 - はてなるせだいあり

    のざきさんの 「AT&TがEUC(Extended UNIX Code)をUNIXの文字符号化手法として使うようになったのって正確にはいつからなんですかね」 について。FreeBSD 4.6.2 からのわたしが解説しますよ。 結論からいえば 1985 年で、この年に System V Release 2*1 に対する拡張として、Japanese Application Environment がリリースされたようです (要公式リリース資料)。ただし、それが「EUC」という名前だったかについては今のところ不明。 その前段階として件の日語UNIX システム諮問委員会では当然議論があったわけですが、その一員にAT&T UNIX Pacificがいる。ゆえに、1984年以前から実装は開始されていて、委員会へ開示されたタイミングである1984年がそのコードに残っているのではないか、と推測してみるわ

    いつ誰がEUCを作ったか 2009-03-08 - はてなるせだいあり
  • 携帯電話の絵文字 - なるせにっき

    そういえば、NTT DoCoMo の絵文字は Shift_JIS のユーザ定義文字だったなぁと思って見ると、ユーザー定義文字対応で自動的に Shift_JIS to Unicode の変換に対応していた。というわけで、対応したことにしよう。 ついでに J-PHONE 絵文字にもごそごそと対応してみる。エスケープ文字を Shift_JIS で用いるという変態的な仕様だけど、 (誰が考えたんだこんな仕様) 対応は 40 行ほどでさくっと完了。 au もついでに見てみたけど・・・、なにこれ・・・、テーブル使わないと変換できないじゃないか・・・。放置決定・・・。

    携帯電話の絵文字 - なるせにっき
    darashi
    darashi 2007/03/06
  • 1