なんか,全角チルダ「〜」が文字化けするという苦情が来ました.Linux上のRubyで文字処理をして,Windowsユーザに提供するプログラムを書いた時の話です.調べると,こんな感じに,確かに妙に文字が変化しました. // Shift_JISに変換したあとに,UTF-8に変換し... 続きを読む
ちょちょまwww 半角カナ対応 - UnderDone(あんでるどん)の落書き IS2022JPの半角カナ対応 - perl-mongers.org WIDE系 IRCで使われている、IS2022JPの(いわゆる)半角カナにはいろいろ種類がありますが、これをPerlでコード変換しようとした場合、Encodeモジュ... 続きを読む
;;; 認識されている全部のフォントリストは ;;; w32-bdf-filename-alist ;;; を評価すれば得られます。 ;;; Windows TruetType フォントの場合は、 ;;; (insert (prin1-to-string (w32-select-font))) ;;; を 評価して、 ;;; "-*-\202l\202r \226\276\222\251-n... 続きを読む
Encode - 規格のバグまでは直せませんにコメントしながら思ったのだが、JIS X 0208の1区33点「波ダッシュ」をUnicodeに変換する際、U+FF5EのFULLWIDTH TILDEに変換するのは明らかに間違いだ。この件に関して、私が知る限りのことを、ここに記しておこうと思う。... 続きを読む
The requested blog was not found on this server -- unless you requested that of Dan Kogai (小飼 弾). どういうものかというと、こういうものです。 use LWP::UserAgent; use HTTP::Response::Encoding; my $ua = LWP::UserAgent->new(); my $res = $ua->g... 続きを読む
#前に社内wikiに書いておいたのを公開してみるテスト。 Catalystでマルチバイトを扱う機会があるのは主に ユーザーがフォームで入力する値 ($c->req->param()) データベースからの入出力 (DBIx::Class) それ以外の文字列の評価 View::TTによる出力の生成 FillIn... 続きを読む
2007年1月14日 sambaをUTF-8で使う Sambaのunix charsetはLinuxでの生活を考えてEUC-JPにしていたのだが、ウチからLinuxなクライアントマシンが居なくなってしまったのと、イマドキのLinuxはフツーja_JP.UTF-8でしょ? ってことでUTF-8にすることした。 やるこ... 続きを読む
最終更新 2003-11-11 UCSとUTF ユニコードで文書を作るとき,文字コードの方式が2種類,あるいはそれ以上あることに気が付かれるかもしれません。例えば,一つはUnicodeとあるのに対し,もう一つはUnicode (UTF-8)と表記されているかもしれません。この2つは... 続きを読む
The requested blog was not found on this server -- unless you requested that of Dan Kogai (小飼 弾). spacer.pl #!/usr/local/bin/perl use strict; use warnings; use Encode; my $east = qr/(?!\p{M})(?:\p{Han}|\p{Katakana}|\p{Hiragana})/; my $west... 続きを読む
[Perl] Encodeモジュールで文字コードの変換ができるが、MIMEエンコードをするには以下のようにすればよい。 続きを読む
えーと、本名に「辻」の字がある立場として、またかよという感想です。 というのも、自身の戸籍は登録(出生)時は、二点しんにょうの辻だったのですが、数年前に戸籍謄本を取る必要があり確認してみたところ、いつの間にか勝手に一点しんにょうの辻に変えられて... 続きを読む
とりあえずこんなお知らせ(?)を、学内MLに流しました。 適当に御利用下さい。 ---------------------------------------- マイクロソフトが提供する Internet Explorer の最新版 IE7 をインストールしたあと、ファイル名に全角文字(漢字)を含むファイル... 続きを読む