タグ

utf-8に関するheitattaのブックマーク (3)

  • Ruby 1.9 m17n リファレンス (不完全版) - diary of a madman

    以前書いた記事(Ruby 1.9 の新機能を調べてみた)の m17n がらみの箇所についてコメントやらトラックバックやらをいただいたので、もう少し調べてまとめてみた。 なお、1.9.0 リリース版ではなく、開発版(trunk r14835)で動作を確認している。 コマンドラインオプション -E --encoding "ruby -E エンコーディング名" または "ruby --encoding=エンコーディング名" のように使う。 Encoding.default_external を指定したエンコーディングに変更する。 コマンドラインで指定したスクリプトファイル(または -e で指定したスクリプト)のエンコーディングを変更する。(スクリプト内でマジックコメントによるエンコーディング指定を行なったのと同じ効果だが、マジックコメントで指定がある場合はそちらが優先) -K ruby 1.8

    Ruby 1.9 m17n リファレンス (不完全版) - diary of a madman
  • [を] UTF-8 の文字にマッチする正規表現

    UTF-8 の文字にマッチする正規表現 2006-03-09-1 [Programming] UTF-8の文字にマッチする正規表現の素直版。 レガシーなのに対応するとき用にメモ。 [\x00-\x7f]|[\xC0-\xDF][\x80-\xBF]|[\xE0-\xEF][\x80-\xBF]{2}|[\xF0-\xF7] [\x80-\xBF]{3}|[\xF8-\xFB][\x80-\xBF]{4}|[\xFC-\xFD][\x80-\xBF]{5} 1 2 3 4 5 60xxxxxxx 110xxxxx10xxxxxx 1110xxxx10xxxxxx10xxxxxx 11110xxx10xxxxxx10xxxxxx10xxxxxx 111110xx10xxxxxx10xxxxxx10xxxxxx10xxxxxx 1111110x10xxxxxx10xxxxxx10xxxxx

  • [を] PerlとUTF8についての自分用メモ

    PerlとUTF8についての自分用メモ 2005-09-29-1 [Programming] 自分用メモなので網羅性はないです。 utf8 - ソースコード内に、UTF-8(か、UTF-EBCDIC)を有効/無効にするた めのプラグマ <http://perldoc.jp/docs/perl/5.8.1/utf8.pod> Perl 5.8 以降においての Unicode 文字列の扱い方 : NDO::Weblog <http://naoya.dyndns.org/~naoya/mt/archives/000611.html> Perl 5.8.x における日語コード変換のメモ <http://www.hikoboshi.org/perl/doc/encode.html> Perl 5.8.x Unicode関連 <http://www.pure.ne.jp/~lea

  • 1