タグ

文字コードに関するdharryのブックマーク (3)

  • Debin Sarge をUTF-8環境で利用する

    最近は、FedoraやSUSEでUTF-8をシステムのデフォルトロケールで利用して来てます。 そこで、DebianもUTF-8環境に変更してみました。 Debianには、デフォルトで"ja_JP.eucJP"のロケールしか作成されていません。そこで、"UTF-8"(ja_JP.UTF-8)のロケールを作成します。 #dpkg-reconfigure locales で、"ja_JP.UTF-8"ロケールを作成します。デフォルトロケールの選択も"ja_JP.UTF-8"に。 ログイン時に読み込むファイルに、"LANG=ja_JP.eucJP"って設定してある場所があれば、"LANG=ja_JP.UFT8"に変更します。 .xsession、.gnomerc、.bashrc、.bash_profile辺りをチェックしてください。 次に、アプリ関係です。大まかには以下の事をしておき

  • 文字コードの発展経緯から役割と仕組みを学ぶ

    コンピュータを使っていると,画面上でさまざまな文字を目にすると思うが,これはすべて文字コードという考え方に基づいて表示している。ただ,コンピュータの内部と通信用で違う種類の文字コードを使い分けるケースも多く,なにかと複雑。これが原因で文字化けもしょっちゅう起こる。そこで,文字コードの世界を探ってみることにしよう。なお,この記事は日経NETWORK 2002年2月号に掲載したものです。それ以降の情報が盛り込まれていませんので,現在とは異なる場合があります。文字コード規格の基礎を手早く理解したい場合などにお役立てください。 インターネット上でやりとりされるデータは,すべて0か1のビットの列で表す。画像だろうと音楽だろうと,ビット列であることに変わりはない。文字だって同じである。 このため,ある文字をどのようなビット列に置き換えるのかということを,あらかじめ決めておく必要がある(図1)。具体的に

    文字コードの発展経緯から役割と仕組みを学ぶ
  • 文字コード規格の基礎:ITpro

    この記事は,日経ソフトウエア 1999年10月号に掲載したものです。それ以降の情報が盛り込まれていませんので,現在とは異なる場合があります。 文字コード規格の基礎を手早く理解したい場合などにお役立てください。 文字コードは間違いなく情報を交換するための「決まりごと」なので,正確を期すため厳密な仕様が規定されている。だが,その仕様そのものを実装するプログラムを作る場合を除けば,プログラマが仕様の詳細を隅々まで理解している必要はない。六法全書を読んでいなくても問題なく普段の生活ができるようなものだ。 ここでは,通常のプログラミングをするうえで必要と思われる範囲のことを,なるべく簡潔に説明したい。「半角カナ」のような呼び名は正確さを欠くものだが,多くの人に伝わりやすいので説明の中でも使っていく。説明を簡略化するため「正確な仕様を知りたいときは規格書そのものを必ず参照してほしい」と書きたいところだ

    文字コード規格の基礎:ITpro
  • 1