タグ

utf-8に関するkakkyz81のブックマーク (2)

  • L'eclat des jours(2008-03-02)

    _ UTF-32からUTF-16とUTF-8を作る ちょっと調べる必要があったので、作った。(追記:タイトルは嘘ですね。2バイトを越えた——素のUTF-16で表現できない文字の変換) #!/usr/local/bin/ruby if ARGV.length != 1 STDERR.puts 'usage: ruby u.rb 0xコード' exit 1 end ch = ARGV[0].to_i(16) u = ch - 0x10000 u0 = u >> 10 | 0xd800 u1 = u & 0x3ff | 0xdc00 printf "surrogate pair = \\u%04x \\u%04x\n", u0, u1 u = [18, 12, 6, 0].inject([]) do |r, x| r << (ch >> x & 0x3f | 0x80) end u[0] |=

  • ターミナルまるごとコード変換 - 世界線航跡蔵

    先日の東京・関東Rubyist忘年会の席で、「UTF-8で日語を記述したRspecをwindowsで動かすと文字化けして困る」という話があった。 で、「それcocotでできるよ」と言おうとしたのだけど暫く使ってなかったのでとっさに"cocot"の名前が出てこなかった。 cocot は「端末(tty)とプロセスの間に割り込んで、文字コード変換を行うツール」。だから、cocotの下でシェルを動かしてしまえばあとは意識せずにコード変換してくれる。 シェル丸ごとだと今度は標準コマンドの出力が化けるかも知れないけど、だったらalias spec="cocot -p UTF-8 spec"とかすればいい。

    ターミナルまるごとコード変換 - 世界線航跡蔵
    kakkyz81
    kakkyz81 2007/12/26
    文字化け大作
  • 1