タグ

エンコーディングに関するtegetegetegeのブックマーク (4)

  • 第8回■主要言語の文字エンコーディングの対応状況を押さえる

    文字コードの問題に正しく対応する前提として,アプリケーションが稼働する基盤ソフトウエアがマルチバイト文字列処理に対応している必要がある。特に問題となるのが,言語処理系とデータベース管理システム(DBMS)である。利用者の使い方が正しくない場合も,ぜい弱性が混入することがある。このため,今回は主要言語とデータベース(MySQLとMS SQL Server)のマルチバイト文字対応状況について説明する。 文字列の処理単位は文字単位かバイト単位か Webアプリケーション開発で人気のあるスクリプト言語の多くは,かつては文字列をバイト単位で扱っているものが多かった。以下のPerlスクリプトは“漢字”という文字列の長さを表示するものだが,ソースの文字エンコーディングによって結果が変わる。具体的には,Shift_JISやEUC-JPの場合は4,UTF-8の場合は6と表示される。原因は,このスクリプトが文字

    第8回■主要言語の文字エンコーディングの対応状況を押さえる
    tegetegetege
    tegetegetege 2009/03/09
    5C問題。PHPを含む、各種言語でのマルチバイトの扱い。DB接続時の扱いの説明もあり。
  • メールにかけられた呪文「MIME〜前編」

    MIME(Multipurpose Internet Mail Extensions)~前編:インターネット・プロトコル詳説(3) メール転送プロトコルにはメール・フォーマットが前提にある メールプロトコルについて解説する前に、インターネットで使用されるメールのフォーマットについて説明しよう。なぜなら、SMTP、POP、IMAPといったプロトコルが、インターネットメールの標準フォーマットを前提にしているからだ。 インターネットメールのフォーマットは、基となるインターネットメールのフォーマットに、MIMEと呼ばれる拡張形式を含めて確立されていると考えてよい(表1・2)。 1972年

    メールにかけられた呪文「MIME〜前編」
  • 住建部:建立和完善房地产市场平稳健康发展的长效机制 自1作机制建立以来1合-武冈新擞蔬菜行情网

    最新文章 2018-12-26 00:55▪ 审计署:649人次因扶贫问题受处理处分 2018-12-26 00:55▪ 上海清算所2项成果荣获2017年度银行科技发展奖 2018-12-26 00:55▪ 泸州男子因欠巨额网贷绑架干女儿索要10万元赎金 2018-12-26 00:55▪ 南宁“两客一危一货”2018年已致236人死亡(图) 2018-12-26 00:55▪ 北海一女子以跳楼逼男友现身消防员用床垫救人 2018-12-26 00:55▪ 考研英语单词“难”到上热搜?专家:单词未超纲 2018-12-26 00:55▪ 国新办举行《三北防护林体系建设40年综合评价报告》发布会 2018-12-26 00:55▪ 博白一货车撞断民房承重柱担心房倒不敢挪车 2018-12-26 00:55▪ 山东:两年统筹400余亿元支持生态建设 2018-12-26 00:55▪ 真把自己

  • Unicode対応 JIS X 0208 文字コード表

    Unicode対応 JIS X 0208 文字コード一覧 JIS X 0208 の区点番号、JISコード、シフトJISコード、EUCコード、Unicode(UTF-8, UTF-16)の文字コード対応一覧です。 文字コードとその文字を順に出力しているだけですので、表示される文字はフォントによって決まります。 01区~08区 JIS非漢字(各種記号、英数字、かな) 13区~13区 NEC特殊文字(機種依存) 16区~47区 JIS第1水準漢字 48区~84区 JIS第2水準漢字 文字コードについてのページや、文字コード一覧についての説明もあります。 JIS X 0208 JIS非漢字 文字コード表 区 点 JIS SJIS EUC UTF-8 UTF-16 字 01 01 2121 8140 A1A1 E38080 3000 01 02 2122 8141 A1A2 E38081 3001

    tegetegetege
    tegetegetege 2008/02/12
    Unicode対応のJIS第一水準漢字の文字コード表
  • 1