タグ

2010年2月19日のブックマーク (8件)

  • JIS, EUC, SJIS の漢字コードについて

    back 3つの 漢字コード 現在、コンピュータ上で日語テキストを表現するのに用いられている 漢字コードはおもに 3種類ある (昔は区点コードというコード体系も あったが、今ではすたれてしまった)。その 3種類は次のようなものである。 なお、最初に「0x」がつく文字列は、それが 16進数 (Hexadecimal) 表記であることを表す。 JIS漢字コード ASCII コード 0x21 〜 0x7E の文字 2つを組み合わせて 1つの 漢字を表現する。制御文字 (文字コード 0x1F 以下の文字) と共有できる、7bit 転送でも表現できる などの利点があるものの、漢字と通常の ASCII コード文字 (single-byte のアルファベット) が 共存できない。このために「漢字 IN」と「漢字 OUT」という 2つの 制御シーケンス (制御文字列) が導入されている。 漢字 IN …

    mikasa06
    mikasa06 2010/02/19
    古典的マトリックス表あり
  • 日本語の代表的なエンコード(早わかり 文字コード 15分講座)

    ※類似コードはざっくりいうと確かに違いますが、大きな違いはありません (怪しい文字や機種依存文字は使わないようにしておけば大丈夫です)。 エンコード方式の特徴 固定長 固定長であれば計算や処理が単純になりますが、実行時にならなければ文字長がわからない場合、処理が複雑になります。 バイトコードを解釈するコスト ASCIIの頃はたった1バイトでしたが 2byte,3byteと殖えてしまうと、それだけで解釈や対応コストがかかります。例えば英語圏なども影響を受け、使いもしない2byteコードのソフトを作らなければなりません。また、エンコード方式が複雑であるほど、変換や解釈にコストがかかることになります。 同時表現可能性 日語だけ表示するのであれば問題ありませんが、中国語などと多国語を同時に表現する場合、Shift-JISだけでは表示しきれません。そこで多言語対応を目的として Unicodeが発

    mikasa06
    mikasa06 2010/02/19
    CP932兄弟の話
  • 7.2 ASCII の NUL と DEL の本来の意味 - 文字コードに関する覚え書きと実験

    文字コードについて調べたことや実験したこと, テストプログラム,データファイルなどを随時掲載する予定です. ただし筆者の理解不足や誤解により誤りがあるかもしれませんので, ご利用は自己責任で. このページの主な更新は Blog でお知らせします. 表示確認ブラウザ:FireFox 22.0,IE8. 0.目次 シフトJIS Shift_JIS と Windows-31J (CP932) の違い シフトJIS 2バイト文字の判定 謎の検索ワード集 (シフトJIS編) 「Shift_JIS(SJIS,Windows-31J,CP932) 3バイト文字」 「Shift_JIS(SJIS,Windows-31J,CP932) サロゲート(ペア)」 「UTF-8 4バイト文字 Shift_JIS(SJIS,Windows-31J,CP932) 変換」 「Unicode(UTF-8,UTF-16) か

    7.2 ASCII の NUL と DEL の本来の意味 - 文字コードに関する覚え書きと実験
    mikasa06
    mikasa06 2010/02/19
    コード表ダウンロード
  • @IT:Javaの文字化け対策FAQ(3)

    JSP/サーブレット・プログラミングで誰もが一度は遭遇するトラブルが文字化けだ。予期せぬ文字化け発生に、デバックに苦労した経験を持つ読者も多いだろう。連載では、JSP/サーブレットにおける文字列の扱いの基礎を復習した上で、文字化けの解決策を要点よく解説していく予定だ。(編集部) 質問1:ファイルやメール、DBで「~∥‐¢£¬」が文字化けします 解答: 各種文字コードとUnicodeの間の変換ルールを見直しましょう 前回説明したとおり、「~∥‐¢£¬」の文字化けは、「Unicodeと各種文字コード間の変換ルールの違い」によって発生するものだ。これらの文字について、Windows-31JとUnicode間の変換ルールは、その他の文字コード(Shift_JIS、EUC_JP、ISO-2022-JPなど)に用いられる変換ルールとはまったく異なる。よって、Windows-31Jとその他の文字コード

    @IT:Javaの文字化け対策FAQ(3)
  • [入門~応用] Java サンプルプログラム集 - Javaプログラム全集

    新しくJavaでプログラムを組む場合では、その9割以上が以前使ったロジックです。 当サイトでは、管理人の開発経験の中から使用頻度が高い項目を優先して選び、逆引き式(目的別) にまとめました。 一つ一つには、すぐにコピーアンドペーストして使えるように最低限度の動作確認済みのJavaサンプルコードを加えました。 更に、プログラムしてよく間違えるパターンを注意書きとして加えると共に、応用が利くようにアドバイスも出来るだけ付け加えました。 配列や制御構文など基的な文法から最新のJDK1.5やAJAXまでの解説を提供しています。 プログラミングする際に、初心者・中級者が悩むところ・誤りやすい論点はほぼ網羅できたと思っておりますが、日々技術動向を目をむけ少しずつ加筆・修正を行なっております。 (1)目的別に分類されたコード、(2)応用が効くような詳細な解説、(3)コピー&ペーストとちょっ

  • @IT:文字化け“???”の法則とその防止策

    連載では、現場でのエンジニアの経験から得られた、アプリケーション・サーバをベースとしたWebシステム開発における注意点やヒントについて解説する。巷のドキュメントではなかなか得られない貴重なノウハウが散りばめられている。読者の問題解決や今後システムを開発する際の参考として大いに活用していただきたい。(編集局) 今回のワンポイント 文字化けは、複数の文字規格とベンダごとの実装の違いにより、昔から悩まされ続けている問題である。特にJavaでは、文字が“?”に化けるという問題に遭遇するケースが多い。その大半は、Java内部の文字列がUnicodeとして扱われているために、それに伴うコード変換が原因となって発生している。今回は、BEA WebLogic Server(以下WebLogic)を例に取り、文字化けが発生した場合の確認ポイントと対策について紹介する。 JSPのプリコンパイルで文字化け発生

    @IT:文字化け“???”の法則とその防止策
  • An Unicode vendor-specific character table for japanese (日本語のUnicodeベンダ依存文字表)

  • tips/フォントを変えよう - Windows Phone, Windows 8 Store アプリ by Smart-PDA.net

    Microsoft の標準フォントは、Mac と比べてあまり綺麗とは言えません。 PocketPC は画面が PC に比べて非常に狭いので、PC 以上に目が疲れます。RealVGA 環境ではなおさらです。 そこで少しでも見やすくするためにフォントを変更してみます。 見え方ががらっと変わりますよ! そこでフリーで配布されているフォントWindows Mobile デバイス に導入して綺麗な画面表示を実現します。 毎日使うのがより一層楽しくなりますよ。