タグ

2016年10月31日のブックマーク (7件)

  • 文字コードの部屋 -- 半角カナ

    半角カナを表現する時の、エンコード別の解説。ちょっと不充分です。 半角カナの扱い シフト JISで半角カナを用いる場合 シフト JISでは、半角カナに相当する文字領域が、つぎの領域に割り当てられています。 SJIS| 0 1 2 3 4 5 6 7 8 9 A B C D E F ----+------------------------------------------------ A | 。「 」 、 ・ ヲ ァ ィ ゥ ェ ォ ャ ュ ョ ッ B | ー ア イ ウ エ オ カ キ ク ケ コ サ シ ス セ ソ C | タ チ ツ テ ト ナ ニ ヌ ネ ノ ハ ヒ フ ヘ ホ マ D | ミ ム メ モ ヤ ユ ヨ ラ リ ル レ ロ ワ ン ゛ ゜ ISO-2022-JP で半角カナを用いる場合 ISO-2022-JP には、半角カナに相当するコードは含まれていません。 そこ

  • .NET 文字列がJIS X 0208 漢字第二水準までで構成されているかをチェックする

    C#、VB.NETで文字列がJIS X 0208 漢字第二水準までで構成されていることをチェックします。 最近のWEBサイトは文字コードをUnicodeで作成するため、文字化けを考慮することは少なくなってきましたが、一昔前までは文字列をWindowsMac両方で文字化けなく表示させるため、入力できる文字に制限を付けることが一般的でした。 その際よく用いられるのが「JIS漢字第二水準まで許可」という仕様です。これは『半角英数字記号、全角記号・特殊文字、数字、ラテン文字、ひらがな、カタカナ、ギリシャ文字、キリル文字、罫線素片、漢字第1水準、漢字第2水準』で構成された文字列かどうかを判定します。

    .NET 文字列がJIS X 0208 漢字第二水準までで構成されているかをチェックする
  • JISコードによる入力可能文字の判定(第1水準、第2水準、第3水準、第4水準、半角文字など) - tekkの日記 C#,VB.NET

    他のシステムにデータ連携を行う場合などに、文字化けを起こさないよう入力文字のチェックを行う場合があります。 今回は、JISコードを使って入力可能文字の判定処理を整理したいと思います。 まず、JISコードの体系ですが「区点番号」という番号体系で文字コードが付与されています。2バイト文字の場合、上位バイトが区、下位バイトが点となっています。区毎に94の点で構成されており、区単位で設定される文字が決まっています。 01区 記号 02区 記号 03区 英数字 04区 ひらがな 05区 カタカナ 06区 ギリシア文字 07区 キリル文字 08区 罫線素片 16〜47区 第一水準の漢字 48〜83区 第二水準の漢字 これらのJIS漢字コードについての詳細な説明は以下のサイトで確認してください。 JIS漢字コード:JIS第一・第二水準 http://www.shuiren.org/chuden/teac

    JISコードによる入力可能文字の判定(第1水準、第2水準、第3水準、第4水準、半角文字など) - tekkの日記 C#,VB.NET
  • Shift_JIS系文字一覧イメージとSJIS・MS932・CP943・SJIS2004の違い - instant tools

    語を扱える文字コードにはメジャーなものでUTF-8, Shift_JIS, EUC-JP, UTF-16, ISO-2022-JP(JIS)などがあります。 近年UTF-8を使う傾向が強まっていますが、今でもShift_JISは多用されています。 ところがこの「Shift_JIS」にはいくつかバリエーションがあります。 Shift_JIS系1バイト文字 Shift_JIS系の1バイト文字は、以下のようになっています。00~1F, 7Fは制御文字、20~7Eはアスキー文字です (SPACEはアスキー文字としても制御文字としても扱われることがあります)。 ここはUTF-8でもEUC-JPでもJISでも共通です。 A1~DFは半角カナが割り当てられています。半角カナを(エスケープシーケンス無しで) 1バイトで表現できるのはShift_JIS系文字コードの特徴です。 下位4ビット 012345

  • 本当は怖くないCP932 - Qiita

    先に結論 CP932 は、Shift_JIS の独自実装 符号化文字集合がいろいろ拡張されている 拡張文字の有無で、Shift_JIS と判別可能 CP932ってなあに? 実はいろいろある Microsoftコードページ932 IBMコードページ932 PC-9800仕様OEMコードページ932 Windows-31J(MS932) Microsoftコードページ932 Microsoftが、MS-DOS 用に作った Shift_JIS の実装 IBMコードページ932PC-9800仕様OEMコードページ932 IBM、NECが作った、Microsoftコードページ932 の拡張 Windows-31J(MS932) Microsoftが互換性確保の為に、IBM、NECの拡張を吸収した、Windows 用の CP932 CP932 といったらほぼほぼこれを指す MS932 は、Java

    本当は怖くないCP932 - Qiita
  • Unicode対応 JIS X 0208 文字コード表

    Unicode対応 JIS X 0208 文字コード一覧 JIS X 0208 の区点番号、JISコード、シフトJISコード、EUCコード、Unicode(UTF-8, UTF-16)の文字コード対応一覧です。 文字コードとその文字を順に出力しているだけですので、表示される文字はフォントによって決まります。 01区~08区 JIS非漢字(各種記号、英数字、かな) 13区~13区 NEC特殊文字(機種依存) 16区~47区 JIS第1水準漢字 48区~84区 JIS第2水準漢字 文字コードについてのページや、文字コード一覧についての説明もあります。 JIS X 0208 JIS非漢字 文字コード表 区 点 JIS SJIS EUC UTF-8 UTF-16 字 01 01 2121 8140 A1A1 E38080 3000 01 02 2122 8141 A1A2 E38081 3001

  • http://charset.7jp.net/jis.html

    nanamasuhoshi
    nanamasuhoshi 2016/10/31
    文字コード(日本語漢字コード表)