タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

文字化けに関するmtoyoshiのブックマーク (13)

  • 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。

    「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ

    文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。
  • MORIYAMA Masayuki's Home Page!

    森山 将之のホームページへようこそ! あなたは、1996年8月26日から数えて 番目の訪問者です。 更新情報 2004年7月24日更新 キーボード関連 親指シフト配列 2002年6月6日更新 キーボードの配列図 1997年6月3日更新 キーボード配列案 2003年10月12日 更新 - 最新作 USBキーボードのキーコード 2002年3月14日 新規作成 Windows での USBキーボードの諸問題 2001年11月13日 新規作成 文字コード関連 機種依存文字 2000年1月20日更新 JIS X 0201 片仮名(半角カナ) 2002年4月2日更新 第3,第4水準漢字 1998年5月2日新規作成 表示だけでは機種依存文字か判別できない文字 1998年5月3日新規作成 Windows-31J 情報 2003年8月21日 更新 ソフトウェア 簡単なライブラリやパッチなど ちょっとした資料

  • サロゲートペア入門

    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicodeでデータ処理

    サロゲートペア入門
  • character-sets

    Last Updated 2022-07-14 Available Formats XML HTML Plain text Registry included below Character Sets Registration Procedure(s) Expert Review Expert(s) Martin Dürst Reference [RFC2978] Note These are the official names for character sets that may be used in the Internet and may be referred to in Internet documentation. These names are expressed in ANSI_X3.4-1968 which is commonly called US-ASCII or

    mtoyoshi
    mtoyoshi 2010/04/08
    IANA文字コード一覧
  • 文字コードの部屋 -- 文字セットの種類

    JIS ローマ字が左に、JIS カタカナが右に来るので、 X 0201 左側 ・・・・・ JIS X 0201 のローマ字のこと X 0201 右側 ・・・・・ JIS X 0201 のカタカナのこと のように、「X 0201 左側」「X 0201 右側」などと呼ぶことがあります。 「C 6220-1976」は、後に「JIS X 0201-1976」と名称だけ改められました。 JIS X 0201-1997 何が変わったの? 2. JIS X 0208 JIS X 0208-1978 (JIS C 6226-1978) 6802字。アルファベット、数字、ひらがなカタカナ、ギリシャ文字とキリル文字、これらの非漢字に加えて、JIS 第一水準、JIS 第二水準を収録します。 アルファベット、数字、カタカナの部分は、JIS X 201 と重複します。それで、 X 0201 ・・・・・ 半角文字 X

  • 日本の文字コード

    では、JIS(日工業規格)が文字の規格を定めています。日語で文書を表現するにはカタカナだけでなく、ひらがなや漢字が必要になります。漢字は数万種類あるといわれており、このうち日常的に用いられる文字を選定しても6千文字以上にもなり、256種類しかない8ビットではとても表現できません。 規格番号 タイトル 通称 収録文字数 解説 JIS X 0201 7ビット及び8ビットの情報交換用符号化文字集合 ANK ANK(アンク;Alphabetic Numeric and Kana)は、ASCIIコードを8ビット(2の8乗=256種類)に拡張し、独自のカタカナを加えて半角文字を表現しています。アルファベット部分をJISローマ字、カナ部分をJISカナなどとも呼びます。 ANK(JIS X 0201)コード表

  • 特番 Windows Vistaの新文字セットが引き起こすトラブル:ITpro

    【記者の眼】 Unicodeは「使える」から「知らずに使う」フェーズへ  Windowsにおいて「Unicode」は,長らく「使える」けれども「あまり使われない」存在だった。その状況が「Windows Vista」と「the 2007 Microsoft Office」で変わろうとしている。この2製品に付属する「Microsoft IME」で,「WindowsではUnicodeでしか扱えない文字」が,変換候補として頻出するようになったからだ。Unicodeはいよいよ,一般ユーザーが「知らずに使う」存在になるだろう。 【記者のつぶやき】 シフトJISを捨てられるか? これまで,Windows Vistaの文字の扱いに関する事柄を何度か取り上げてきた。同じキャラクタ・コードで,Windows XPのときと文字の形が変わったり,Unicodeでしか扱えない文字があったりするという話題だ。今

  • 2010-02-14 - 未来のいつか/hyoshiokの日記

    例えば、次の言葉の意味を知りたい、聞いたことがあるけどよく分かっていないプログラマにとって、お勧めの書籍だ。Unicode/UTF-8/UTF-16/USC-2/JIS X0208/JIS X0212/JIS X0213/SJIS/EUC-JP/CP932/ISO-2022-JP/ASCII/Latin-1/ISO 10646/ISO 8859-1/サロゲートペア/文字化け/機種依存文字/半角カナ/絵文字… JIS X0208やJIS X0213の解説などは圧巻である。書籍にはWebにない利点がある。Webには即時性があるが、文字コードの解説においては、即時性はそれほど求められない。字体ないし字形の差異についてWebではその字体ないし字形がなければ表現しようがないが、書籍であれば細部までこだわって表現できる。 例えば、包摂された「辻」という字の一点しんにょうと二点しんにょうの字体の差はWe

    2010-02-14 - 未来のいつか/hyoshiokの日記
  • 第5回■注目される文字コードのセキュリティ問題

    今回から5回にわたって,アプリケーション全体に関する文字コードの問題と対策について説明する。文字コードがセキュリティとどう関わるのか,疑問に思うかもしれないが,Webアプリケーションで文字コードを指定可能な個所は非常に多く,しかも文字コードの選定や処理方法次第ではぜい弱性の原因になることが分かってきている(図1)。実は文字コードはWebアプリケーションのセキュリティ問題の最新の話題と言ってよい。 2008年10月に開催されたセキュリティ・イベントBlack Hat Japan 2008では,ネットエージェントの長谷川陽介氏が「趣味と実益の文字コード攻撃」と題して,文字コード問題の広範なプレゼンテーションを発表した 。そのプレゼンテーション資料が発表されている のでこの問題の詳細に関心のある方は参照されたい。ここでは,セキュアなWebアプリケーションを開発するために文字コードの問題をどのよう

    第5回■注目される文字コードのセキュリティ問題
    mtoyoshi
    mtoyoshi 2010/01/11
    キャラクタセットとエンコーディングの違い
  • http://www.ingrid.org/java/i18n/encoding/shift_jis.html

    mtoyoshi
    mtoyoshi 2010/01/07
    MS932、Windows31j、Shift_JIS
  • Servlet Garden » Unicode and Character Sets (Translation)

    勉強を兼ねての勝手に翻訳シリーズ第3弾です。今回はJoel Spolsky氏のブログに掲載されていたThe Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)です。掲載されたのは2003年10月と、5年近く前のことなので、現状にそぐわないところもあるかもしれませんが、とても参考になる解説です。 ソフトウェ開発者なら絶対に最低限知っていなければならないユニコードと文字セットについて(言い訳はなしですよ!) 不可解なContent-Typeタグについてかつて疑問に思ったことはないでしょうか?おそらくHTMLファイルに書き込むものということは知ってるでしょうが、なんのためにそれなければいけないのかまでは知ら

  • サロゲートペア入門:CodeZine

    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicode

  • Ingrid.org

    Ingrid.org This Page Is Under Construction - Coming Soon! Why am I seeing this 'Under Construction' page? Related Searches: Best Penny Stocks Best Mortgage Rates Anti Wrinkle Creams Top Smart Phones Healthy Weight Loss Trademark Free Notice Review our Privacy Policy Service Agreement Legal Notice Privacy Policy

  • 1