2017年3月1日のブックマーク (2件)

  • プログラミング言語における文字コードの話

    世の中がほぼUnicode前提になってめでたしめでたし。とはいかなかった現実の話。 String型でできる文字列処理とか、ソースコード自体、特に識別子で使える文字とか。 軽くおさらい: Unicode まあいろんなところでいろんな人が書いてると思うのでさらっと概要だけ。 Unicodeは、元々、「65,536文字あれば十分だろ」とかいう幻想の元、2バイト固定長の文字コードとして作られていました。 もちろん足りなくて、ビット数を拡張。基が2バイトのままでこの拡張した分を取り扱えるようにしたのが今のUTF-16で、拡張分は2文字分(4バイト)を使って表現。 この、2文字分使って1文字を表すやつのことをサロゲートペア(surrogate pair: 代理対)と呼びます。 あと、ASCII文字も2バイトになるのを欧米人が嫌って、ASCII文字はASCIIコードのまま、逆に漢字・ひらがな・カタカナ

    プログラミング言語における文字コードの話
  • Feature watch: ECMAScript 2018

    Check out my book (free online): “Exploring ES2018 and ES2019”. Buy it now and get all future updates. The feature set of ECMAScript 2018 was finalized during the latest TC39 meeting (23-25 January 2018). This blog post describes it. A word on ECMAScript versions  # Note that since the TC39 process was instituted, the importance of ECMAScript versions has much decreased. What really matters now is

    mysticatea
    mysticatea 2017/03/01
    今月末に ES2017 も固まる (?) ので、一足早く ES2018 まとめてるっぽい。Chrome は async iteration 実装中だけど、間に合わないかなー?