タグ

character_encodingに関するSynBooのブックマーク (7)

  • 数値文字参照と日本語文字列の相互変換をする【PHP】 - Programming Magic

    HTMLでは「あいうえお」という文字列を「あいうえお」というように数値で表すことができる。 これを数値文字参照という。 日語文字列を数値文字参照に変換したり、逆に数値文字参照を文字に変換する場合、自力で実装しようとすると、文字エンコードを調べ全ての文字を対応する値に変換するというかなりめんどうな処理を書くことになる。 文字と数値文字参照の相互変換を調べるとmb_encode_numericentity関数とmb_encode_numericentity関数が見つかるが、これは$convmapという値の変換表を自分で用意しなければならないため、これでもかなりめんどくさい。 string mb_encode_numericentity ( string $str , array $convmap [, string $encoding ] ) string mb_decode_numeric

  • 特殊文字コード表

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • エンコードマニアックス - 各種エンコードやハッシュを一発作成

    SHA-256 e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855 SHA-384 38b060a751ac96384cd9327eb1b1e36a21fdb71114be07434c0cc7bf63f6e1da274edebfe76f65fbd51ad2f14898b95b SHA-512 cf83e1357eefb8bdf1542850d66d8007d620e4050b5715dc83f4a921d36ce9ce47d0d13c5d85f2b0ff8318d2877eec2f63b931bd47417a81a538327af927da3e

  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • subtechグループ - 'hceT'.sub(/\Z/,'bus').reverse - add .vimrc

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    subtechグループ - 'hceT'.sub(/\Z/,'bus').reverse - add .vimrc
  • ez-HTMLでUTF-8を! - ほんわかうぃき

    ez-HTMLUTF-8文字コードを認識させる方法 前提 この設定はez-HTML Ver6.81でのみ試しました。スクリーンショットもVer6.81のものです。 よって、他のバージョンで同じように設定できるかどうかは分かりません。 早速設定をっっ ez-HTMLを起動して、メニューより「表示」→「詳細設定」とたどります。 すると、下のような詳細設定ダイアログが出るので「ファイルシステム」→「標準設定」と左側のツリーをたどって、右下辺りにある「UTF-8Nの可能性を考慮」にチェックを入れてOKを押します。 これでUTF-8で保存したファイルをまともに開くことが出来ます。 あとがき HTMLタグをガシガシ書いて作る(僕の場合、大抵はASPかJSPの雛形になる)ようなWebページを作るときにez-HTMLを愛用している。最近はJava/JSP/Servlet/Strutsに病みつき

    SynBoo
    SynBoo 2008/11/05
    今だに文字コードがよくわからない
  • 1