タグ

Encodingに関するnamaniku_keroのブックマーク (2)

  • Perl 5.8.x における日本語コード変換★

    Perl 5.8ではEncode.pmが標準モジュールとなり、多バイト文字を標準で簡単に扱えるようになりました。が、jcode.plやJcode.pmを用いたコード変換の経験があると、逆にこれが仇となって文字化けの嵐に遭います。(私の場合そうだったというだけで、普通はそんなこと無いのかもしれないのですが。)漸く最近になって基的な考え方が飲み込めるようになって来たので、この辺をまとめておこうと思います。なお、メモは新たにPerl 5.8.x的なPerlスクリプトを書く際に気をつけることをまとめたものであり、基的には既存のスクリプトにPerl 5.8 + Encode.pmを適用するためのものではありません。また、utf8でスクリプトを書くことを前提にしています。が、どちらにせよ、この知識は参考になると思います。(たぶん。) 文冒頭ですが、まず参照先を示しておきます。以下のドキュメント

  • 草なぎ剛くんについて重大なお知らせ - rna fragments

    大好きな草なぎ剛くんについてデマが流れているので…! fut573 メモ:『彅』弓+剪はJISにないので、windows以外の環境では正常に表示されない場合が多く、ネット上では使わない事を推奨されている文字の一つである。 へー 2009/04/23 はてなブックマーク - 草なぎ剛、公然わいせつ容疑で逮捕(サンケイスポーツ) - Yahoo!ニュース 「なぎ」の文字コードに関しては JIS コード(JIS X 0208)では外字になってしまいますが、Unicode では CJK 統合漢字に含まれるちゃんとした文字です。HTML や XML で使う場合は文字実体参照文字参照*1を使って彅(または 彅)のようにして表現できます。*2 表示に関しては今時の OS なら大抵大丈夫です。Mac OS X の標準フォントでも Linux で広く使われている IPA フォント

    草なぎ剛くんについて重大なお知らせ - rna fragments
    namaniku_kero
    namaniku_kero 2009/04/24
    携帯で見てると「草 泥酔」「草 公然わいせつ」とかなっていてちょっと楽しい。
  • 1