タグ

ブックマーク / replication.hatenablog.com (1)

  • VBScriptでサロゲートペアの文字を検出する方法 - 小さい頃はエラ呼吸

    はじめに Web系雑記: サロゲートペアをJavaScriptで検出する方法にインスパイアされて、サロゲートペアの文字を検出するVBScriptを作成してみました。 サロゲートペアとは サロゲートペアとは、通称4バイト文字と呼ばれる特殊な文字を表現する方法のことです。サロゲートペアについては、僕が調べた限り、以下の記事が丁寧で分かりやすかったです。 近年、Unicodeに組み込みたいという文字の要望がいろいろと増えてきました。結果的に従来の2バイト(65536文字)では文字が足りない状況になってしまったのです。そこで、解決策としてサロゲートペアという方法が導入されました。これは、「1文字=2バイト」の基は維持しつつ、一部の文字については「1文字=4バイト」にする方法です。 具体的には、従来のUnicodeでは未使用のだった0xD800〜0xDBFF(1024通り)を「上位サロゲート」、

    VBScriptでサロゲートペアの文字を検出する方法 - 小さい頃はエラ呼吸
  • 1