タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

文字に関するsignets_jpのブックマーク (4)

  • JIS2004に含まれるサロゲートペア。Javaでの文字列操作を検証してみた | 株式会社メイプルシステムズ

    最近のマイブームは、映画「アナと雪の女王」関連の色んな動画を子供と一緒に見ることです。でも映画自体はなかなか観に行けずにいます。おにです。 ここのところ、タイトルにある「サロゲートペア(4バイトで1文字を表す文字)」に関わる時間が多く、油断すると錯覚(幻覚?)で「アナと雪の女王」の文字もサロゲートペアに見えて来そうです。(まだ老眼にはなってません。) 今回はその「サロゲートペア」が含まれた文字列のJavaでの文字列操作について試してみたいと思います。 サロゲートペアってなに? サロゲートペアは、上位サロゲートと下位サロゲートを組み合わせて1文字を表現する4バイトのUnicode文字です。Windows Vista(JIS2004)で追加された文字にサロゲートペアは304文字存在します。 Windows XPでは表示できなかった文字なのであまり馴染みはありませんが、Windows XPのサポ

    JIS2004に含まれるサロゲートペア。Javaでの文字列操作を検証してみた | 株式会社メイプルシステムズ
  • シフトJIS(Shift_JIS)コード の漢字文字(2バイトコード)

    太陽光発電状況リアルタイム表示 [日語文字コード] シフトJIS(Shift_JIS)コード の漢字文字(2バイトコード) JIS X 0208 (1990) to Unicode 漢字コード表に存在する(区点コードの)区を区単位で集めました、水色エリアは存在しないコードです 01区 シフトJIS(Shift_JIS)コード表 8140814181428143814481458146814781488149814a814b814c814d814e814f 、。,.・:;?!゛゜´`¨^ 8150815181528153815481558156815781588159815a815b815c815d815e815f  ̄_ヽヾゝゞ〃仝々〆〇ー―‐/\ 8160816181628163816481658166816781688169816a816b816c816d816e816f ~∥|…‥‘

  • Unicode Character 'FULLWIDTH HYPHEN-MINUS' (U+FF0D)

    Unicode Character 'FULLWIDTH HYPHEN-MINUS' (U+FF0D) Browser Test Page Outline (as SVG file) Fonts that support U+FF0D Unicode Data Name FULLWIDTH HYPHEN-MINUS Block Halfwidth and Fullwidth Forms Category Punctuation, Dash [Pd] Combine 0 BIDI European Number Separator [ES] Decomposition <wide> HYPHEN-MINUS (U+002D) Mirror N Approximations <wide> 002D Version Unicode 1.1.0 (June, 1993) Encodings HTM

  • JIS, ISO-2022 のコーディング

    一般に JIS コードといわれているのは ISO-2022-JP の事です ( JIS コードは日工業規格が、 ISO-2022-JP は ISO が決めた規格ではありますが )。 ISO-2022-JP は ISO-2022 のサブセット ( 機能の限定などしたもの ) です。まず最初に ISO-2022 について説明しましょう。 図中にあるエスケープシーケンスを 表1 にまとめます。 図中で [F] は読み込んでくるコードの種類によって異なる値が割り振られています。 どのコードにどの文字が割り振られているかの表を 表2 に示します。 なお、ESC $ ( [F] で [F] が @,A,B の場合、 ( を省略します。 表中でJISXなんとかとなっていない文字コードは日語でない別の言語の文字コードです。 図1をご覧ください。 ISO-2022 では G0-G3 のバッファに各国の文

  • 1