探したのだけど作っている人がいなかったので、いわゆるutf-8-macと呼ばれるエンコーディングを追加するEncode::Encodingをつくりました。https://github.com/tomi-ru/Encode-UTF8Mac use Encode; use Encode::UTF8Mac; print Encode::encode('utf-8-mac', '蘄... 続きを読む
java.io.InputStreamReader、java.io.OutputStreamWriter、java.lang.String、および java.nio.charset パッケージのクラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、J... 続きを読む
Java エンコーディング名 別名一覧 (JDK 1.4.1 版) JDK 1.4.1 でのエンコーディング名の一覧を抽出してみました。JDK 1.3.1 の一覧については こちらのサイト で 公開されているかたがいらっしゃいます。 JDK 1.3.1 から変更されている点については簡単にコメン... 続きを読む
文字エンコーディングの変換を行うと、異なる2文字が同じ文字に変換されることがあります。このような文字を重複文字と呼ぶことにします。UTF-8→Shift_JISおよびUTF-8→EUC-JPについて、重複文字を自分用の資料としてまとめてみました。 MacOSX上のPHP5.2.9で... 続きを読む
開拓の前に 連載最後の開拓は、日本語処理を取り上げたいと思います。中でも「文字化け」という地雷原を突き進むので、みなさん気を引き締めてついてきてください! なお、今回使用するMySQLのバージョンは、バイナリ配布されているCommunity Editionの最新版で... 続きを読む
Description From えむけい 2005-12-27 21:18:38 JST Bug-org 73035 comment #6で触れられていますが、EUC-JPの掲示板にMozillaで補助漢字 を投稿すると、IEやOperaのユーザーには読めないテキストが簡単に生成されてしまいます。 EUC-JPエンコーダから補助漢字... 続きを読む
プロフィール Author: kosaki 連絡先はコチラ ブログ検索 最近の記事 reclaim処理からwritepage処理を削除する活動が開始 (10/12) mem_notifyのダウンロードできる場所おしえて。だと (10/10) 2.6.27 (10/10) LWNで発表された2.6.27での貢献度リスト (10/09) 遅... 続きを読む
以前に書いた関連記事 上の投稿で「〜」が「潤オ」に文字化けする理由として、「〜」には2種類あると書きました。 フォントで表すと以下の2種類です。 全角チルダ:〜 (半角 ~ の全角版) 波ダッシュ:〜 ウィキペディア:チルダ ウィキペディア:波ダッシ... 続きを読む
Yahoo!掲示板で文字化け Yahoo!の掲示板で、繫 (つなぐ)という文字を入力すると文字化けをするという投稿がありました。「繫」はJIS第1水準/第2水準にある「繋」の異字体でJIS補助漢字に有る文字です。 (注)JIS第1水準/第2水準 1978年にコンピューター用の漢... 続きを読む
今昔文字鏡(こんじゃくもじきょう)は、エーアイ・ネットが開発し、紀伊國屋書店が販売する、Windows用の漢字検索ソフトと印字用フォントを組み合わせた入力、印字用アプリケーションソフトウェア。最新版の収録字数は17万字以上である。 [編集] 概要 漢字を中... 続きを読む
とつか町だよりにもコメントしたが、「者の中に点のある渚」と「者の中に点のない渚」とに関しては、「辻」や「龍」とは違う、また独特の問題があったりする。とりあえず、人名用漢字表とJIS規格票の周辺を追ってみることにしよう。 JISの原案にあたる『情報交... 続きを読む
Catalystではモジュールをuse する順番が大事だという話。 use Catalyst qw( -Debug Charsets::Japanese ConfigLoader Dumper FillInForm FormValidator::Simple ); この順番でuse するとFillInFormの結果で化けてしまいます。 入力項目に日本語を入力してValid... 続きを読む