タグ

Unicodeに関するtabarkaのブックマーク (4)

  • JSで CodePoint 数えたい

    ここで一句 JSで文字列を16bit単位ではなくUnicode Code Point単位で数える方法はいくつかあるが、結局2017年5月時点で(IE11のようなブラウザも含めて)ほとんどの環境で動作する方法はどれなんだろう。調べたのでまとめておきます、ご指摘あればどしどし(ง ‘-’ )ง 参考 JavaScript における文字コードと「文字数」の数え方 | blog.jxck.io Unicode のサロゲートペアとは何か - ひだまりソケットは壊れない JavaScriptでのサロゲートペア文字列のメモ - Qiita ECMAScript 6 compatibility table Unicode コードポイント Unicode では全ての文字にID(コードポイント)(0 ~ 0x10FFFF)をふっている。 コードポイントを表す時は U+{16進数} と書く。 UTF-16 では

    JSで CodePoint 数えたい
  • [Android] 文字列に絵文字が含まれるか雑に判定する。 - Qiita

    背景 ユーザーにパスワードを入力してもらう時にクライアント側で絵文字の入力を禁止したかったので、雑に絵文字入力を判定するにはどうすればいいか考えました。 無理やり絵文字の入力を許すような仕組みにすることもできたかもしれませんが、絵文字は同じデータ値であっても環境によって表示される画像が違っていたり、サポートの有無もあるはずなのでパスワードとして使うのは適切でないでしょう。 事前知識 そもそも文字コードに関しての知識もあやふやだったので、それついて理解することから始めました。ここで簡単にまとめてみたいと思います。 文字コード 文字コード(もじコード)はコンピュータ上で文字(キャラクタ (コンピュータ))を利用するために各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係(文字コード体系)のことを指して「文字コード」と呼ぶことも多い。 引用:Wikipedia つまり、文字デ

    [Android] 文字列に絵文字が含まれるか雑に判定する。 - Qiita
  • javascript - でBMP以外のUnicode文字をきちんと扱う : 404 Blog Not Found

    2013年03月29日16:00 カテゴリTipsLightweight Languages javascript - でBMP以外のUnicode文字をきちんと扱う 文字コード「超」研究 深沢千尋 一肌脱ぐか。 dankogai/js-codepoints ・ GitHub Twitter時代の文字の数え方 | 配電盤正確には、「Unicode 3.1時代の文字の数え方」なのでしょうが、Unicodeの最新バージョンが6.0の今、それではぱっとしないのでSYNOPSIS log('𠮷野家'.length ); /* 4 // unfortunately */ log('𠮷野家'.codePointsOf() ); /* 3 // naturally */ log('𠮷野家'.codepoints ); /* 3 // naturally */ log(String.fromCode

    javascript - でBMP以外のUnicode文字をきちんと扱う : 404 Blog Not Found
    tabarka
    tabarka 2017/04/03
    “𠮷野家”
  • beforeやafter疑似要素のcontentプロパティで日本語の文字化けを回避する方法

    CSSの擬似セレクタ :before と :after において、content プロパティに日語を設定すると、表示時に文字化けが起こってしまう場合があります。大半のブラウザでは文字化けが起こらないのですが、マルチブラウザをサポートしなくてはいけないような場合に備え、予防線を張っておく必要があります。 文字化けする要因CSSを外部ファイル定義している場合に起こるCSSファイルの文字コードが Shift_JIS でない (UTF-8 等)文字化け回避方法直接日語を書くと文字化けする場合がある例えば下記のように直接contentプロパティに日語で定義した場合、文字化けとなってしまう場合があります。 .test:after { content:"€ユーロ"; }前述の通り、ブラウザ依存による文字化けなので、ブラウザに依存しない方法で記述してあげましょう。 日語の文字化けを回避する定義方法

    beforeやafter疑似要素のcontentプロパティで日本語の文字化けを回避する方法
  • 1