タグ

encodingに関するkiyoshi1211のブックマーク (14)

  • 特殊文字コード一覧

    コードを半角で書き込むか、特殊文字をコピー&ペーストで使います。 環境によっては表示されない文字もあります。 ! ===> ! " ===> " # ===> # $ ===> $ % ===> % & ===> & ' ===> ' ( ===> ( ) ===> ) * ===> * + ===> + , ===> , - ===> - . ===> . / ===> / 0 ===> 0 1 ===> 1 2 ===> 2 3 ===> 3 4 ===> 4 5 ===> 5 6 ===> 6 7 ===> 7 8 ===> 8 9 ===> 9 : ===> : &#59; =

  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • MySQL 文字化け問題を本気で直す

    mysql> status; -------------- mysql Ver 14.7 Distrib 4.1.20, for redhat-linux-gnu (i386) using readline 4.3 Connection id: 36 Current database: staff2006 Current user: maiha@localhost SSL: Not in use Current pager: lv Using outfile: '' Using delimiter: ; Server version: 4.1.20 Protocol version: 10 Connection: Localhost via UNIX socket Server characterset: latin1 Db characterset: latin1 Client char

  • れぶろぐ - [PHP] Zend Framework で出力文字エンコーディングを変更する

    ■ Zend Framework で出力文字エンコーディングを変更する 携帯に対応するために、HTTP 出力をシフト JIS に変換したいと思ったので、 Zend Framework ではどうやればいいのか調べてみました。 マニュアルにはほとんど説明が書かれていないのですが、 Zend_View には Zend_View_Filter という output filter の機能が実装されているので、これを利用します。 まず、実際の処理を行う Sjis.php というこんなファイルを作り、 Revulo/View/Filter のようなディレクトリに配置します。 <?php class Revulo_View_Filter_Sjis { public function filter($value) { header('Content-Type: text/html; charset=Shif

  • 文字コードに起因する脆弱性を防ぐ「やや安全な」php.ini設定

    補足 この記事は旧徳丸浩の日記からの転載です(元URL、アーカイブはてなブックマーク1、はてなブックマーク2)。 備忘のため転載いたしますが、この記事は2010年9月27日に公開されたもので、当時の徳丸の考えを示すものを、基的に内容を変更せずにそのまま転載するものです。 補足終わり PHPカンファレンス2010にて「文字コードに起因する脆弱性とその対策」というタイトルで喋らせていただきました。プレゼンテーション資料をPDF形式とslideshare.netで公開しています。 文字コードのセキュリティというと、ややこしいイメージが強くて、スピーカーの前夜祭でも「聴衆の半分は置いてきぼりになるかもね」みたいな話をしていたのですが、意外にも「分かりやすかった」等の好意的な反応をtwitter等でいただき、驚くと共に喜んでいます。土曜にPHPカンファレンスに来られるような方は意識が高いというの

  • 文字コードに起因する脆弱性とその対策

    4. 徳丸浩の自己紹介 • 経歴 – 1985年 京セラ株式会社入社 – 1995年 京セラコミュニケーションシステム株式会社(KCCS)に出向・転籍 – 2008年 KCCS退職、HASHコンサルティング株式会社設立 • 経験したこと – 京セラ入社当時はCAD、計算幾何学、数値シミュレーションなどを担当 – その後、企業向けパッケージソフトの企画・開発・事業化を担当 – 1999年から、携帯電話向けインフラ、プラットフォームの企画・開発を担当 Webアプリケーションのセキュリティ問題に直面、研究、社内展開、寄稿などを開始 – 2004年にKCCS社内ベンチャーとしてWebアプリケーションセキュリティ事業を立ち上げ • その他 – 1990年にPascalコンパイラをCabezonを開発、オープンソースで公開 「大学時代のPascal演習がCabezonでした」という方にお目にかかること

    文字コードに起因する脆弱性とその対策
  • 圧縮ファイルの作成&ダウンロード - Do You PHP?

    ここにある情報はかなり古くなっており、正しくなくなっている可能性があります。掲載しているサンプルコードiなどは、最新のPHPでは動作しない、もしくは、別途設定・調整が必要になるかも知れません。情報を鵜呑みにせず、あなたの手を動かして、あなたの目で確認してください。 zip形式 tgz形式 PHP3の頃にもあったネタですが、PHP4.xでも基的には同じです。 zlib圧縮関数を使って圧縮したデータファイルを作成し、ダウンロードさせるサンプルです。上のリンクからtgz、zipの各家意識でダウンロードできるようにしています。 zlib圧縮関数を使用するには、zlib 1.0.9 以上をインストールしておく必要があります。また、PHPのconfigure時に「--with-zlib」オプションを付けます。再install後、phpinfoを実行し、サポート状況を確認しておきます。zlib-1.

  • 巨大なSJISのCSVファイルをfgetcsv関数で処理する - hnwの日記

    さて、前回記事「PHPでメモリ上に一時ファイルを作る」では、file_get_contents関数でCSVファイル全体を取得して文字エンコーディングの変換を行い、変換結果に対してfgetcsv関数を利用しました。しかし、CSVファイルが巨大な場合にはfile_get_contentsを使うとメモリ上限に引っかかってPHPが停止してしまいます。 もちろん、UTF-8CSVファイルに対してfgetcsvを利用するのであれば、どんな大きなCSVファイルだろうと処理することが可能です。なぜなら、fgetcsvはファイルを1行単位で読み込む関数ですから、1行分のメモリ消費だけでファイル全体を読み込み続けられるからです(正確にはストリーム上のデータはバッファリングされるので、バッファサイズ分のメモリは消費しますが)。 それでは、巨大なSJISのCSVファイルをfgetcsvで処理したい場合はどうすれ

    巨大なSJISのCSVファイルをfgetcsv関数で処理する - hnwの日記
  • Yoheis.net: PHPのdate()関数で文字化け

    20070903 PHPのdate()関数で文字化け PHPの内部文字エンコーディングがSJISの場合に echo date('Y年m月d日'); を実行すると 2007・09月03日 のように文字化けしてしまう。 これはShift-JISコードにおいて"年"という文字は2バイト目がasciiの"N"と同じで、これがdate()関数のformat指定子であるのが原因である。 EUC-JPやUTF-8では2バイト目以降にascciコードは出てこないので(参考:文字コードについて)、以下のようなコードでこの問題を解決できる。 function myDate(string $format, $time) { $encoding = mb_internal_encoding(); mb_internal_encoding("UTF-8"); $formatUtf8 = mb_convert_enc

    kiyoshi1211
    kiyoshi1211 2010/09/14
    これと同じ症状。やはり文字コードの問題か
  • CP932 on Meadow

    Meadow で CP932 CP932 は基的には Shift_JIS としてデコードすれば良いのですが、IBM 拡張文字 (115区〜119区)が含まれていると化けてしまいます。 これを Meadow で取り扱う方法です。 cp932.el を `load-path' の通ったところに 置く。 ~/.emacs に (require 'cp932) と書く。 coding-system に cp932 を指定する。例えば、ファイルを開く時には C-x RET c cp932 RET C-x C-f filename RET とするなど。 autodetect 以下のような設定で、autodetect できるかもしれません。 (when (require 'cp932 nil t) (setq coding-category-ccl 'cp932) (set-coding-prior

  • サービス終了のお知らせ

    平素より「PHPプロ!」をご愛顧いただき、誠にありがとうございます。 2006年より運営してまいりました「PHPプロ!」ですが、サービスの利用状況を鑑みまして、2018年9月25日(火曜日)をもちましてサービスを終了させていただくことになりました。 サービス終了に伴いまして、2018年8月28日(火曜日)を持ちまして、新規会員登録ならびにQ&A掲示板への新たな質問、回答の投稿を停止させていただきます。 なお、ご登録いただいた皆様の個人情報につきましては、サービス終了後、弊社が責任をもって消去いたします。 これまで多くの皆様にご利用をいただきまして、誠にありがとうございました。 サービス終了に伴い、皆様にはご不便をおかけいたしますこと、心よりお詫び申し上げます。 件に関するお問い合わせはこちらよりお願いいたします。

    kiyoshi1211
    kiyoshi1211 2010/09/12
    文字化けに関してあとでkwsk
  • 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。

    「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ

    文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。
  • ウノウラボ Unoh Labs: 日本語とPHP

    yamaokaです。 PHPで日語を扱う場合、mbstringモジュールを利用する場合が多いと思います。 日語に特有の機能(カタカナの全角/半角変換など)も備わっていて、とても便利です。 しかし、日以外ではmbstringモジュールはあまり利用されていないようです。 代わりに利用されているのがiconvモジュールで、 最近話題のフレームワーク、symfonyでも 国際化の機能を実現するために内部で利用されています。 iconvモジュールはPHP 5でPHP体に組み込まれました。 別途用意して組み込む必要があるmbstringモジュールと違って、最初から使用できるので便利ですね。 PHPのマニュアルのiconv関数のページを見ると、 いくつかの関数が定義されているのがわかります。 それぞれ、mbstring関数との 対応表を作ってみました。 iconv関数mbstring関数

  • 1