タグ

文字コードに関するeinherjarのブックマーク (6)

  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • PHPで UTF-8←→SJIS の変換を行う場合の注意:地方で活動するweb制作者の日々を綴るblog

    2007年03月01日03:25 カテゴリ技術-PHP PHPUTF-8←→SJIS の変換を行う場合の注意 php で文字コード変換をする場合は mb_convert_encoding("ほげほげ", "SJIS", "UTF-8")といった感じで変えられますが mb_convert_encoding("郄橋", "SJIS", "UTF-8")とやると文字化けします。 つまり、Shift-JISの拡張文字をUTF-8 (から|へ) 変換しようとすると化けるらしい。 拡張文字の代表としては「磲」とかも。 あとは「?????」のローマ数字の類もそう。 解決としては mb_convert_encoding("郄橋", "SJIS-win", "UTF-8")これだけ? って感じですが、これで問題なく変換できます。 これだけでなぜ通るのか、ちょっと調べたけれどよくわかりませんでした。 詳し

  • Just a moment...

    Checking your browser before accessing the website. This process is automatic. Your browser will redirect to your requested content shortly. Please wait a few seconds.

  • http://blog.livedoor.jp/skrowty/archives/50527502.html

  • JIPS - Wikipedia

    JIPS(ジップス Japanese Information Processing System)はNECが開発した日語処理システムの名前である。実際上は、『JIPS』という用語は、そのシステム上で使われる漢字コードの事を指していることが多いため、稿ではその漢字コードについて説明する。 概要[編集] 『JIPS』にて使われる漢字コードは、JIS C 6226-1978をベースに拡張文字を9区〜13区に登録し、さらにGR域に『G1集合』と呼ばれる拡張文字群を登録した符号化文字集合である。 上記そのものを表すJIPS(J) JIPS(J)の上1バイト、下1バイトをそれぞれEBCDICに変換して得られるJIPS(E) JIPS(J)の上1バイトをASCII文字と被らないようにシフトしたNEC内部コード(J) NEC内部コード(J)の上1バイト、下1バイトをそれぞれEBCDICに変換して得られ

  • Vine4.0のUTF-8化

    ようやくVine Linux4.0がリリースされた。Vine4.0でも標準的な日語環境は引き続きEUCである。そんなわけで、今だにUTF-8でないのは時代遅れと いう理由 でVineを中 傷し、ただ巨大でいろんな選択肢が多いというだけの海外ブランドディストリビューションに走らせようとする勢力もあるようだ。まさに片腹痛い話である。 ただし、世間はたしかにUTF-8に向いている。XMLしかり、perlしかりであり、UTF-8の世界で仕事をすることにはそれなりの必要性も生じてい る。実は、Vine4.0をUTF-8環境にするのはそんなに難しくないし、3.2でもそう難しいことではなかったのだ。 ここで、Vine4.0をUTF-8環境にするためのTIPSをまとめてみた。3.2についても若干触れている。 1. おすすめしないが、システム全体をUTF-8にする /etc/sysc

  • 1