タグ

文字コードに関するmepati0323のブックマーク (3)

  • Post Position 【Unity】 ファイルの文字コードの変換

    Unityで扱うソースコードの文字コードの変換について。 最近はUTF-8がどの環境でも主流になってきた文字コードだが、 UnityでもUTF-8かUTF-16にしないとエディタ内で文字化けが発生することがある。 スクリプトを新規作成しても文字コードがShift-JISで作成され、 現在のところはそのデフォルトの設定はどうも変更出来ないようだ。 そこで文字コードを変換するのにどういう手段があるのかを幾つか紹介したい。 まずはUnityのAssetPostProcessorで変換してしまうという方法。 ■スクリプトファイルのutf-8変換 プロジェクトツリーに入っているものは何でも「アセット」として扱われるから、 ソースコードすらもAssetPostProcessorで操れる。 このスクリプトをプロジェクトに入れておけば、新規作成時からUTF-8として作ってくれる。 ただこの方法では、コピペ

  • PHP - マジッククォートとSJISの文字化け問題 - Shoulder.jp

    へんじがない。ただのポンコツのようだ。 ポンコツが今日も持ち場でガンバリつつ、 楽しく生きていくための備忘録ブログ。ぬわーーっっ!!2005年7月から絶賛「更新」中! 【この記事の所要時間 : 約 5 分】 PHPには、マジッククォート(magic quotes)というものがある。これは、php.ini にて、magic_quotes_gpc が ON になっている場合に有効となる機能であり、GPC(Get/Post/Cookie)からの入力値について以下のパターンで変換する。 「”」 → 「\”」 「’」 → 「\’」 「\」 → 「\\」 これは、\ (バックスラッシュ)によるエスケープとも呼ばれる。 このマジッククォートは、文字コードがSJISの時に意外な問題(文字化け)が発生する。 それは、以下のようなものである。 「表」 → 「表\」 「能」 → 「能\」 「申」 → 「申\」

    PHP - マジッククォートとSJISの文字化け問題 - Shoulder.jp
  • 文字コードとセキュリティ(クロスサイトスクリプティングなど)

    では、このHTMLタグの無効化(サニタイジング)はどうすればいいかといいますと、皆さんご存知のように、左の表のように置換すれば良いことになります。これは、下記のような文字化け を悪用した攻撃にも効果的です。 例えば、「<」は16進文字コードで「0x3C」です。確かに、「<」で表示される文字(1バイト)なら、Shift_JISでもEUC-JPでもJISでも文字コードは一緒でしょう。しかし、もし「0x3C」を2バイト文字(漢字)の一部であると解釈すればどうでしょうか? Shift_JISやEUC-JPには幸い「0x3C」は現れませんが、JISには現れます。 例えば、「紗」という漢字は、Shift_JISでは0x8ED1ですが、JISでは0x3C53です。0x3C53は、Shift_JISやEUC-JPでは、「1バイト文字が二つある」としか解釈できまず、この場合、「0x3C=<」「0x53=S」

  • 1