タグ

webとcharsetに関するu-chanのブックマーク (5)

  • サイトやブログの運営でよく使いそうな.htaccessの設定のまとめ

    ウェブサイトやブログの運営でよく使いそうな便利な.htaccessの設定を紹介します。 こういうまとめは定期的にあがってきますが、やっぱり必要なのでシェアします。 10 useful .htaccess snippets to have in your toolbox [ad#ad-2] 下記は各ポイントを意訳したものです。 URLからwwwを削除 hotlinkingの防止 feedをfeedbunnerにリダイレクト カスタムエラーページ ダウンロードファイルの処理 PHPのエラーのログ URLからファイルの拡張子を削除 ディレクトリのファイルリストを見せない ファイルを圧縮して軽量化 文字コードの指定 URLからwwwを削除 SEOなどの理由で、URLからwwwを削除して使うことがあるかもしれません。このスニペットは、あなたのウェブサイトにwww付きでアクセスしてきてもwww無しに向

    u-chan
    u-chan 2011/06/01
    とりあえず、ブクマ。
  • UTF-8の冗長なエンコードとは何で、なんでそれがセキュリティ的に危ないのか?を文字コード知識レヴェル3くらいの凡プログラマが考えてみる - tohokuaikiのチラシの裏

    何故かあたり前にならない文字エンコーディングバリデーション | yohgaki's blog ってあるように、いまいち文字コードの不正な判定による危険性ってのが分かってない。 SJISの問題は、(2/3)SQLインジェクションを根絶!セキュア開発の極意 - 第5回■注目される文字コードのセキュリティ問題:ITproの記事がわかりやすかった。 というか、やっぱりPHP使ってると誰でも一度は「なんじゃこの『¥』は?」って思うもんなんで。 なるほど、確かに↓の図のように「あるバイト」が2つの意味を持つっていう文字コード形態はやばいんだなと。 EUC-JPはそんなことはしないで、1つのバイトには1つの意味しか取らせない。 だけど、これでも文字化けが起こることがある。経験的には、「マルチバイトをXX文字で切り落としたい」とかやった場合。ちゃんと文字コードを判定してくれるPHPでいえばmb_subst

  • News - 絵文字標準化 by Google : 404 Blog Not Found

    2008年11月30日02:00 カテゴリNewsiTech News - 絵文字標準化 by Google 悲しい知らせだ。 Google Japan Blog: 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ 現在、日の携帯絵文字の全てをユニコードの文字として共通符号化しようという提案が進行しています。そのためには、現在使用されている絵文字のうちどれが既にユニコード符号化されているか、新しく符号化しなければならない絵文字はどれかなどを調査する作業が必要です。この提案を支援する目的で、私たちが提案している絵文字のマッピングや変換表、更に絵文字データからHTMLの表などを作成するのに役立つツールなどを 「emoji4unicode 」という名前でオープンソースプロジェクトとして公開します。 日絵文字が“世界進出”へ グーグルが標準化提案 (1/2ページ) - MSN産

    News - 絵文字標準化 by Google : 404 Blog Not Found
    u-chan
    u-chan 2008/12/01
    何もやらないキャリアと手を付けたGoogle。これが日本のITの実態。
  • 文字化けしたメールの修復

    インターネットで届いたメールは、メールソフトがMIMEに正しく対応していなかったり、JISコードのシーケンス切り替えができなかったりして文字化けしてしまうことがあります。こうした文字化けは、多くの場合、簡単な仕組みで復元することが可能です。 ※以下のサービスは別サーバーで提供します。 From, Subjectなどの読めないヘッダを修復 =?ISO-2022-JP?B?GyRCJD8hIxsoQg==?= のような件名など 文字化けしている文の修復 $B$3$l$O(JJIS$B$NJ8$G$9!#(Jのような文字化け Unicode文字参照になっている文の解読 こん...のような、 '&#' と ';' に数字が挟まれたコードが連続する文 ツールで解読できない文字化けもあると思いますが、このページの作者に直接メールで依頼しないでください。残念ながら個別に

  • UTF-8 エンコーディングの危険性 - WebOS Goodies

    的に、まともな国際化ライブラリを使っていれば、上記のような不正な文字コードはきちんと処理してくれるはずです。実際、 Opera, Firefox, IE ともに適切にエスケープしてくれました。また、 UCS に変換した後にエスケープ処理を行うことでも対処できるかもしれません。しかし、複数のモジュールで構成されるような規模の大きいアプリケーションでは、そのすべてが適切な処理を行っていると保証するのも、なかなか難しいかと思います。ここはやはり、すべての外部入力に含まれる不正なシーケンスを、水際で正規化するという処理を徹底するのが一番かと思います。 例えば Ruby の場合、不正な UTF-8 コードを検出する最も簡単な方法は、 String#unpack を使って UCS へ変換してみることです(昨日の記事への kazutanaka さんからのはてぶコメントにて、 iconv でも同様なこ

  • 1