MacIE5でArray.pushを実装 MacIE5でArray.pushが必要になったんで、作りました。以下のコードをJavaScriptのコードに入れておくと、Arrayオブジェクトにpushメソッドが追加されます。pushメソッドが既にある場合は、上書きしません。 // Array.pushをMacIE5に実... 続きを読む
MacIE5でdecodeURIを実装 MacIE5でdecodeURI()が必要になったんで、作ったけど、これでいいのかな。 if (typeof decodeURI != 'function') { decodeURI = function (s) { // via http://homepage3.nifty.com/aokura/jscript/utf8.html var _from_utf8 = functio... 続きを読む
■メイリオチェッカー改め『CCチェッカー』【好評販売中!!】 Windows Vista 上で作成した文字コードをチェックします! Windows Vista で JIS X 0213:2004(JIS2004) をサポートした事により、Windows Vista 上で作成された文章がWindows Vista 以外のWindows ... 続きを読む
Unicodeのテキストをあつかう上で、「結合文字列」と「Unicode正規化」はどうしても避けることのできない問題です。ここではあまり深く掘り下げずに、ユーザの眼を通してこれを見ていこうと思います。 まずはじめに、Unicodeには「特殊な文字」があることを知っ... 続きを読む
以前のエントリ(ヒラギノでは全角でデザインされていない文字)で、わたしは以下のように書いた。たとえば「○か×か」というテキストをヒラギノで表示した際、「×」だけが小さく見えて困惑したといった経験を、多くのMac OS Xユーザが持っていると思う。これは... 続きを読む
UTF-7 を使ってスクリプトを記述 +ADw-SCRIPT+AD4-alert(\'XSS\');+ADw-+AC8-SCRIPT+AD4- IE は、文字エンコーディングが不明で UTF-7 っぽい文字列があれば、自動判別で UTF-7 となる。 続きを読む
Microsoftのサイト(JIS X 0213:2004 対応と新日本語フォント「メイリオ」について)から入手できる資料には、Windows VistaのMSゴシックおよびMS明朝について、以下のような記述がある。字形セットとしては、Windows XPで利用可能だった122文字のJIS90字形に、... 続きを読む
そういえば日曜日の「もじもじカフェ」、お出でくださった皆様どうもありがとうございました。いつも一番の楽しみは、終わった後の懇親会だったりするんですが、その席である学生さんから「文字コードを勉強するとっかかりになるような文章、ありませんか?」と... 続きを読む
■表外漢字字体表のヒゲ政策がダメな理由 明朝体の筆押さえ(ヒゲ)には、「分」や「公」などの上部の「八」に付くものと「父」や「延」などの右払いに付くものがある。 以下、便宜的に前者を「ハチヒゲ」、後者を「チチヒゲ」と呼ぶ。図は写研の本蘭明朝、ヒゲ... 続きを読む
この記事は,日経ソフトウエア 1999年10月号に掲載したものです。それ以降の情報が盛り込まれていませんので,現在とは異なる場合があります。 文字コード規格の基礎を手早く理解したい場合などにお役立てください。 文字コードは間違いなく情報を交換するため... 続きを読む
2008/09/10 HFS+はアイテム名をNFDに正規化しますが、規格通りのものではなく、互換漢字などは正規化しないApple独自の特殊なNFDです。 これ自体は昔も今もまったく変わらないのですが、10.4のFinder上でアイテム名を編集すると、規格通りのNFDが適用されるよう... 続きを読む
Encode::EUCJPMSのバージョンが上がってるじゃん。 Perl, LEP | 23:14 | メーリングリストを見ていたら、ミラクルリナックスの森山さんからレガシーエンコーディングプロジェクトの報告が。ざっとながめると ※ Encode::EUCJPMS で CP50220 と CP50221 が利用... 続きを読む
やっていることは「高度な JavaScript 技集」の「UTF-8 <-> UTF16 変換」と同じ。 function toUTF8Octets(string) { return unescape(encodeURIComponent(string)); } function fromUTF8Octets(octets) { return decodeURIComponent(escape(octets)); } encodeU... 続きを読む
Shift_JISエンコードやEUC-JPエンコードなども可能な escape エンコード・デコード関数のライブラリ 文字列をすべてのコンピュータで読めるような形式に変換したり、変換されたものを元の文字列にデコードすることができる関数のライブラリです。 ビルトイン関... 続きを読む
ぼくが“はてブ”をやめた理由 2006年09月15日 23:31 あ、すいません。正確にはやめていません。著しく使用頻度が下がっている、というのが正解です。センセーショナルなタイトルにしたら、たくさん“はてブ”されるかと思ってついついやってしまいました。本当... 続きを読む
小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの 特別編31 JIS X 0213の改正を総括する(3) JIS X 0213の改正と「漢字を救え!」キャンペーン ● 9年前から始まった、あるキャンペーン 「漢字を救え!」キャンペーンとは、1997年頃... 続きを読む
今回の文字規格の変更では、文字コード自体は維持された。すなわち、シフトJISである。一方、これを変更する、という案もあった。 ── シフトJISというのは、本来的に、限界のある規格である。どういじっても、十分な文字数は収められない。そこで、全面改... 続きを読む
■ モヒカン即身仏 面白がってモヒカン刈りにしてみたけど(って単にモヒカン族に入ってみたっていう比喩ね)、丁々発止が予想していた以上にたくさんかみ合って嬉しい驚き。かみ合わないと思っていたわけではなく、自分が尊敬しているかたがたと真剣なやりとり... 続きを読む
2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。 最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなけ... 続きを読む
[編集] 概要 一般的に人間の耳の可聴周波数帯域は 20 - 20,000Hz 程度であり、騒音の大きさを表わすホンと同義である音圧範囲では -20 - 140db 程度である。これに対して人間の発する音声の周波数帯域では、100 - 7,000Hz 程度、音圧範囲では 30db - 60db 程度... 続きを読む
iandeth. Perl, Flash ActionScript, MySQL, Movable Type, システム開発 - そんなテーマのサイトdeth. 1) 症状 日本語文字(とその他マルチバイトコードの文字)が「??????」といった文字列に置き換わってしまいます。BLOG管理画面のエントリ一覧等、直接デー... 続きを読む
MySQL version 4.1 において、日本語キャラクタセット(およびその他マルチバイトキャラクタセット)での使用を前提としてしたセットアップ/環境構築を行う際に知っておくべき情報や、知っておくと「なんでそんな挙動?うきぃ!」と錯乱せずに済むかもしれない... 続きを読む
なんちゃってモールス信号エンコード/デコードフォーム 全角ひらがな → 信号は、エンコード欄に記入して[エンコード]ボタンを押せれ。 信号 → 全角ひらがなは、デコード欄に記入して[デコード]ボタンを押せれ。 全角ひらがなと数字のみ。記号は正し... 続きを読む
by Hippo2000(2000/7/12) Perlを使って日本語の入ったXMLファイルを処理しようとするさい、これまではencodingをどうするかというのが1つの悩みでした。 私は好きなマッピング・ファイルを"Shift_JIS"、"euc-jp"などのためのマッピング・ファイルにするための... 続きを読む
機種依存文字とは、インターネットで各人の使用するマシン(ウィンドウズ、マック、UNIX等)によっては読めない文字のことです。よく見かけるのはローマ数字、丸数字などですが、機種の異なるマシンの人には文字化けして見える(読めない)ため、インターネ... 続きを読む