タグ

charsetとutf-8に関するhideokiのブックマーク (2)

  • UTF-8 エンコーディングの危険性 - WebOS Goodies

    的に、まともな国際化ライブラリを使っていれば、上記のような不正な文字コードはきちんと処理してくれるはずです。実際、 Opera, Firefox, IE ともに適切にエスケープしてくれました。また、 UCS に変換した後にエスケープ処理を行うことでも対処できるかもしれません。しかし、複数のモジュールで構成されるような規模の大きいアプリケーションでは、そのすべてが適切な処理を行っていると保証するのも、なかなか難しいかと思います。ここはやはり、すべての外部入力に含まれる不正なシーケンスを、水際で正規化するという処理を徹底するのが一番かと思います。 例えば Ruby の場合、不正な UTF-8 コードを検出する最も簡単な方法は、 String#unpack を使って UCS へ変換してみることです(昨日の記事への kazutanaka さんからのはてぶコメントにて、 iconv でも同様なこ

  • hori-uchi.com: SledgeでUTF8なサイトを作る。

    SledgeでUTF8なサイトを作る。 Sledgeはプログラム内で扱うデータがEUC-JPにエンコードされたバイナリデータを前提としていて、テンプレートもEUC-JPで作成する必要があります。 これだけが原因ではないのですが、UTF-8なサイトを作ろうとすると、結構いろいろなワナがあります。 このことはSledgeのメーリングリストでも、過去にいろいろ議論されています。 http://lists.sourceforge.jp/mailman/archives/sledge-users/2004-March/000281.html http://lists.sourceforge.jp/mailman/archives/sledge-users/2004-March/000292.html http://lists.sourceforge.jp/mailman/archives/sledg

  • 1