タグ

unicodeに関するtsimoのブックマーク (6)

  • 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ

    絵文字とは、顔の表情やその他のシンボルなどを絵で表現した文字で、日の携帯電話ユーザーの間で特に人気があり、広く使用されているものです。先月、Gmail でも絵文字が使用可能になりました。詳しくはGmail チームのブログポスト「Gmail で絵文字が使えるようになりました 」をご覧ください。 これらの絵文字は携帯電話会社が各々独自に創作したもので、メールやウェブなどで使われています。絵文字は元々各携帯会社のユーザー同士で使用されることを前提に作られたものですが、現在では各社間である程度の互換性を保つための絵文字変換表も利用されています。 ユーザーは携帯会社や機種の違いに関わらず、見慣れている絵文字が表示されることを期待しています。自分がメールで送った絵文字が、受信側でも同じか同等の絵文字で表示されること、ウェブで見る絵文字が他の携帯ユーザーにも同じに見えること、また検索エンジンで絵文字

    絵文字のユニコード符号化: 符号化提案用のオープンソースデータ
  • Press Release TUS 5.0

    Unicode Version 5.1 Released Mountain View, CA, April 4, 2008 – The Unicode Consortium is pleased to announce the release of Unicode 5.1. This release contains over 100,000 characters, and provides significant additions and improvements that extend text processing for software worldwide. Some of the key features are: increased security in data exchange, significant character additions for Indic an

  • Index

    Automatic redirect: http://home.unicode.org/

  • CGI.pmとUTF8 flag blog.nomadscafe.jp

    CGI.pmとUTF8 flag CGI.pmとuse utf8またはuse encodingを一緒に使うと、 #!/usr/bin/perl use strict; use warnings; use utf8; binmode STDOUT, ":utf8"; my $q = CGI->new; print $q->header(-charset=>'utf-8'); print "「" , $q->param('test'),"」が入力\n"; これはうまく動かない。testの部分が文字化けする。use utf8、binmodeの代わりに use encoding "utf8"; としても同じ。 なぜかと言えば、$q->param('test')の戻り値が、utf8 flagがoff、あるいは変な状態でonになっているのが原因だと思われ。use utf8ではflagはたたないし、us

  • perl 5.8における日本語コード変換のメモ

    perl 5.8ではEncode.pmが標準モジュールとなり、多バイト文字を標準で簡単に扱えるようになりました。が、jcode.plやJcode.pmを用いたコード変換の経験があると、逆にこれが仇となって文字化けの嵐に遭います。(私の場合そうだったというだけで、普通はそんなこと無いのかもしれないのですが。)漸く最近になって基的な考え方が飲み込めるようになって来たので、この辺をまとめておこうと思います。なお、メモは新たにperl 5.8.x的なperlスクリプトを書く際に気をつけることをまとめたものであり、基的には既存のスクリプトにperl 5.8 + Encode.pmを適用するためのものではありません。また、utf8でスクリプトを書くことを前提にしています。が、どちらにせよ、この知識は参考になると思います。(たぶん。) 文冒頭ですが、まず参照先を示しておきます。以下のドキュメント

  • vi(vim)でUTF-8を扱いたい

    vi(vim)では、6.x以降でUnicode(UTF-8)に対応させることが可能だ。ホームディレクトリ下(~/)に設定ファイル「.vimrc」を用意し、以下のように設定しよう。すでに存在する場合には、次の2行を見直せばよい。 $ vi ~/.vimrc set fileencoding=japan set fileencodings=iso-2022-jp,utf-8,euc-jp,ucs-2le,ucs-2,cp932

    vi(vim)でUTF-8を扱いたい
  • 1