タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

utf-8に関するgandenのブックマーク (2)

  • 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。

    「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ

    文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。
    ganden
    ganden 2010/07/12
  • Beginning OS X 10.5/アプリ導入編 - Beginning OS X

    [編集] ユーティリティ [編集] lv 日語の扱えるページャとして lv - a Powerful Multilingual File Viewer / Grep がある。 lv は UTF-8 のドキュメントにも対応しているので、jless よりも便利に使える。 $ sudo port install lv サーチコマンドの挙動の違いに関して lv はサーチコマンドの挙動が less と異なる (一旦検索したあとのスラッシュ「/」空打ちが、検索の継続を意味しない) ので、混乱することがある。less での検索操作に慣れきってしまっているなら、 $ sudo port install lv +lesslikeslash を試されたい。 文字化けに関して lv は U+10000 以上の文字には対応していないらしく、たとえば「𠀋 (U+2000B、D840+DC0B のサロゲートペア)

    ganden
    ganden 2009/08/31
    毎回わすれるTexShopでutf-8設定
  • 1