タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

utf-8に関するaraqのブックマーク (3)

  • Rubyのエンコーディング - tmtms のメモ

    Ruby 1.9 から文字列や正規表現オブジェクトはそれぞれエンコーディング(いわゆる文字コード)を保持するようになりました。 たとえば 0xB1 0xB2 という2バイトは EUC-JP エンコーディングでは「渦」、SHIFT_JIS エンコーディングでは「アイ」という文字になります。つまり同じバイト列でもエンコーディングが異なれば異なる文字として解釈されます。 1.8 では文字列はただのバイト列でした。なので、それがどのような文字を表しているのか、つまりエンコーディングが何なのかはプログラムが知っている必要がありました。 1.9 では文字列オブジェクト自身が自分が何のエンコーディングかを知っています。同じ 0xB1 0xB2 というバイト列でも、それが EUC-JP の「渦」なのか SHIFT_JIS の「アイ」なのかは、文字列自身が知っています。 スクリプトエンコーディング スクリプ

    Rubyのエンコーディング - tmtms のメモ
    araq
    araq 2012/09/27
    わかりやすい。1.9でのエンコーディングの扱いが整理できた。
  • さくらインターネットのSSH接続で、Emacs+ruby-modeを使う - itouhiroはてなブログ

    さくらインターネットのレンタルサーバ(月々500円)では、SSHで接続できる。 http://support.sakura.ad.jp/support/manual/rs/tech_ssh.shtml 2009年11月現在、FreeBSD7.1の環境で、最初からEmacs22.3が入っている。 だがEmacs22なので、ruby-modeは同梱されていない。(Emacs23なら同梱されているのだが) ruby-modeは、Rubyの公式サイトで入手できる。 具体的にはソースコードのmisc/ 以下に入っている。ここにある *.el ファイル全部取得する。 http://svn.ruby-lang.org/cgi-bin/viewvc.cgi/branches/ruby_1_8/misc/ ソースコードをすべてダウンロードしても取り出してもよいし、 そのWebページで [最新リビジョン番号を

    さくらインターネットのSSH接続で、Emacs+ruby-modeを使う - itouhiroはてなブログ
  • Emacs22 UTF-8 における文脈依存な文字幅の問題について

    UTF-8 には文字の幅が文脈依存 (ambiguous) となる文字があって、 矢印や記号 (■▲)、罫線などの文字は状況に応じて文字幅が変化します。 下の 2 つの画像は Emacs で同じファイルの内容を narrow character として判定させた場合と、 wide character として判定させた場合のスクリーンショットです。 narrow wide 現状、 Emacs22 はこれらの文字をデフォルトで narrow character として判定します (※のように化けてしまう文字もあります)。 文字によって幅を変えるプロポーショナルフォントを前提としたテキストであれば あまり問題にはならないと思いますが、等幅フォントに向けて書いたテキストでは 表示がガタガタになってしまい問題になります。 これらの文字を wide character として判別させるには以下の設定を

  • 1