タグ

JavaScriptとunicodeに関するbunhikoのブックマーク (2)

  • javascript - URI Encode と Punycode の共存 : 404 Blog Not Found

    2009年01月17日20:30 カテゴリLightweight Languages javascript - URI Encode と Punycode の共存 今度は、JavaScriptで。 404 Blog Not Found:perl - URI::Escape::XS 0.04 - URI Encode と Punycode の共存 デモ 以下のフィールドで相互変換できるようになっています。 全部encodeURIComponent()してしまう版と、「日語URL変換ツール 〜 ピュニコード(Punycode)・UTF-8などのエンコードに」のように「URIのASCII化」だけする版と両方あります。 Decoded: Encoded: Ascii-fied: テスト用のリンク http://日語.jp/カ/ひ?a=漢 http://xn--wgv71a119e.jp/%E3

    javascript - URI Encode と Punycode の共存 : 404 Blog Not Found
  • Unicodeエスケープ - sawatのブログ

    付箋紙Greasemonkeyで、GM_setValueに登録した日語の文字化け対策にencodeURIをつかったけど、encodeURIはURIをエンコードするための関数なのであんまり褒められた使い方ではないですね。しかも、encodeURIのようなURLエンコーディングは文字列をUTF-8にしてから、エンコード対象の各バイトを%xx形式*1で表現するので、日語1文字をあらわすのにたいていの場合ASCII9文字が必要になって効率が悪いです。*2 なので、前述のような単に非ASCII文字をエスケープしたいだけのようなケースではUnicodeエスケープを使った方がよいです。Javaのpropertiesとかnative2asciiとかのやつです。 Unicodeエスケープは\uxxxx*3の形式であらわすので、たいていの日語1文字はASCII6文字になって、URLエンコーディングに比べ

    Unicodeエスケープ - sawatのブログ
  • 1