タグ

characterに関するgugugontaのブックマーク (10)

  • Kazuho@Cybozu Labs: JavaScript の文字列定数でエスケープが必要な文字

    IE、 Firefox、 Safari ともに ECMAScript の仕様を満たしていません。IE6 は ECMAScript の仕様に対して上位互換だと言えるでしょうから、実質的に問題を抱えているのは Firefox のみ、ということになるのでしょうか。JSON を使う際には、注意が必要、と。 Firefox に関して言えば、 (Control Character があるとエラーになるのではなく読み落とすという性質からして) 仕様ではなくバグだと考えるのが妥当なのかなと思いました。 参考: テストコード 10:28 追記: NUL 文字について表に含めるのを忘れていたので追加しました 10:48 追記: Safari を追加 2009/02/17 追記: Firefox のバグは 2008 年 8 月に修正されたようです (ChangeLog の3.147)

  • Unicode 5.0:言語の分裂に挑み続けるUnicodeの新バージョン | OSDN Magazine

    Unicode Consortiumの究極的な目的は、人間界で用いられているすべての言語をコンピュータ上で再現するための標準を定めることだ。こうした目的を完全に達成するのはしばらく先のことになりそうだが、およそ3年をかけた作業の成果としてリリースされるUnicodeバージョン5.0の登場は、目標達成に向けて更なる一歩を前進させることになるだろう。こう説明するのは、同標準の創設者の1人でありUnicode委員会の代表を務めるMark Davis氏である。最終的な公開日が至近に迫った先日、Davis氏は多忙な中時間を割き、Unicodeの開発過程と克服すべき課題について語ってくれた。 Unicodeによるエンコードは、キャラクタとそのプロパティおよび文書による説明という3つの要素で構成されていると、Davis氏は説明する。ただし誤解されがちだが、ここで言うキャラクタとは特定のフォントセット内で

    Unicode 5.0:言語の分裂に挑み続けるUnicodeの新バージョン | OSDN Magazine
  • [鏡] しっぽのさきっちょ 2006年11月 -- Spiegel's Trunk ケータイ族は受動的?

    ネーミングセンス悪いなぁ, 日経。 「ITメタボリック症候群」に,ご用心! チェックリストを見る限り「ITメタボリック症候群」というよりはむしろ IT Addiction だよな。 IT 投資自体が目的化し, それをしないといけないような強迫観念に駆られる。 典型的な嗜癖行動じゃん。 ケータイ族=テレビが好きな層と考えてみる あーあ, ほらね, やっぱり「文明の衝突」もしくは「優越感ゲーム」になっちゃうんだよな。 道具なんてのは二次的なものに過ぎない。 そうでなければ日人ユーザの多くが Yahoo! Japan や楽天や mixi に安住している理由がわからないだろう。 「携帯はコミュニケーションデバイスの面が強い」と言うが, ケータイ上で行われているのがコミュニケーションかどうかも疑わしいし。 あれは単なるコネクションで互いに Keep Alive 信号を送りあってるだけでしょ。 だか

    gugugonta
    gugugonta 2007/04/15
    解説ドキュメント「文字コードとその実装 (PDF)」
  • ショック! ISO/IEC 10646の規格票がフリー・ダウンロード - もじのなまえ

    なんの気なしに「漢字データベースプロジェクト」を見ていたら、以下の記述が。 2006年現在、ISO/IEC 10646:2003、ISO/IEC 10646:2003/Amd 1:2005、ISO/IEC 10646:2003/Amd2:2006は一般にPDFで公開されています。 うそ! だって俺、ものすごい決心して、わざわざ赤坂の日規格協会まで行ってあれのCD-ROM版を買ったんですよ! たしか18,000円くらいとられた覚えが……。 驚いてそこで示されている以下のurlへ行ったら、……あーあ、当だ。無料でダウンロードできるよ。 Freely Available Standards でも、もしかしたらUnicodeやJISのように印刷できない制限付きじゃないかなあ……などと思って実際にダウンロードしたら、ひえ〜、買ったのと全く同一、印刷どころかテキストのコピーだって、しおりだって作れ

    ショック! ISO/IEC 10646の規格票がフリー・ダウンロード - もじのなまえ
  • 文字コードの基本文献は? - もじのなまえ

    そういえば日曜日の「もじもじカフェ」、お出でくださった皆様どうもありがとうございました。いつも一番の楽しみは、終わった後の懇親会だったりするんですが、その席である学生さんから「文字コードを勉強するとっかかりになるような文章、ありませんか?」との質問が。 ネット上で入手できて、信頼性が高く、しかも読んだ後に次のステップが見えてくるような文章。つまり基文献ですね。もちろん、ぼくなどの原稿ではダメダメ。しばらく考えて挙げたのが以下のもの。皆さんならどんな文章を挙げますか? 漢字・日語処理技術の発展:漢字コードの標準化(芝野耕司) 日の漢字コードを前史の段階から詳述 JIS X 0221(ISO/IEC 10646)の目指すもの(芝野耕司) ISO/IEC 10646(Unicode)についての基文献ならこれ 文字コードと図書館(芝野耕司) 標題にとどまらず、国際規格の歴史を詳述 JIS漢

    文字コードの基本文献は? - もじのなまえ
  • http://www.macchiato.com/unicode/chart/

  • miniturbo::Blog 携帯電話での文字コード対応表

    このリストを見る限り、最近の機種は殆どが対応しているようです。SO506iCがEUC-JPに対応しているのは意外でした。 各社の仕様書を見比べると、Shift JISは全社とも対応していて、DoCoMoのXHTML対応機種に限りUTF-8にも対応していることが記載されていました。また、SoftBankの携帯電話はメール及びウェブの文字コードを手動選択できるようです。各社の仕様書を以下にリンクいたしましたので、ご覧ください。 iモード対応HTMLの概要 iモード対応XHTMLの概要 EZWeb サーバ設定・文字コード指定 SoftBank Developers Support Site なお、検証への誘導をしていただいた真琴さんと、多くの機種を検証していただいたreaさん、サンプルを怪しみながらも協力してくれた僕の友人、それからわざわざコメントorトラックバックしていただいた皆々様方に深く感

  • 文字コードについて

    文字コード、標準化について 文字コードについての実用的な説明です。 文字コード表 JIS X 0201、JIS X 0208、JIS X 0213のJIS、EUC-JP、Shift_JIS、Unicodeの文字コード表と、JIS X 0221のUnicodeの文字コード表です。 JIS X 0211 の制御コード表(JIS制御コード) JIS X 0201 の文字コード表(JISローマ字:ASCII、JISカナ) JIS X 0201 の文字コード一覧(Unicode対応) JIS X 0208 の文字コード表(JIS漢字:第1・第2水準) JIS X 0208 の文字コード一覧(Unicode対応) JIS X 0213 の文字コード表(JIS漢字:第1・第2・第3・第4水準) [UTF-8テキスト版] Unicode、常用漢字、人名漢字対応 JIS X 0213 の文字コード一覧 [U

  • 文字コードの話

    稿は、1996年に筆者が大学の所属サークルの機関誌に寄稿した記事をもとに加筆訂正したものです。(最終更新 1999.7.31) 目次 はじめに 第1章 日語のコード体系 第2章 ASCIIと1バイト文字コード 第3章 JIS漢字コードとエンコーディング法 第4章 ISO 2022 第5章 ISO 2022の実例 第6章 中国語・韓国語の文字コード 第7章 ISO 10646とUnicode おわりに 参考文献 はじめに ASCIIだけで用が足りるアメリカと違って、 私たちは日語を扱わなくてはならないため、 より深く文字コードの問題と関わらざるをえません。 それでも、MS-DOS/WindowsMacを使う限りでは、 ASCIIとシフトJIS(たまにJIS)を知っていれば済みますが、 UNIXやインターネットを使い始めると、 JIS・EUC・シフトJISとさまざまな日語コードに頭を

  • は機種依存文字? - Spiegel's Trunk

    コメントに ♥マークを入れたい記事自体はとても参考になるので是非ご覧あれ。引っかかったのは 6A の回答内容。 ただし、ハートマーク自体は機種および環境依存文字となりますので、携帯端末からの閲覧やお使いの環境によりましては正しく表示されない場合もございます。あらかじめご了承ください。 百歩譲って「環境依存文字」はまぁ分からなくもないが,機種依存文字は違うだろう。 機種依存文字は「ベンダ固有文字」あるいは「システム外字」とも呼ばれる(個人的には「ベンダ固有文字」と呼ぶのが好きだけど)。 JIS X 0208 文字集合にない文字(例えば ♥ など)を「外字」としてコンピュータ・メーカなどが勝手に組み込んだものだ。だから同じ文字コードでも「機種」によって表示されるものが違うのだ。 Vox が ♥ などを上手く処理できるのは Unicode の文字集合(UCS)だからだ。 ♥ は UCS に含まれ

  • 1