Unicode is a computing industry standard allowing computers to consistently represent and manipulate text expressed in most of the world's writing systems. Googleは同社の保有しているインデックスに登録されているWebページを調査し、どのエンコーディングがどの程度の割合で使用されているのかについて分析結果を発表した。2012年1月の段階で、UTF-8を採用したページが全体の60%を超えているほか、ASCIIを採用しているページが16%ほどとなっている。ASCIIはUTF-8のサブセットでもあるため、UTF-8に組み入れてカウントすると、実にWebページの80%ほどがUTF-8を採用していることになる。 2001年の段階ではASCII