タグ

2018年9月19日のブックマーク (6件)

  • 文字が特定のエンコーディングで変換可能かどうかを確認する - CLOVER🍀

    Java 7以前のJDKには、 sun.io.ByteToCharConverter sun.io.CharToByteConverter というクラスがあり、ここから以下のようにConverterを取得することで CharToByteConverter ascii = CharToByteConverter.getConverter("ASCII"); CharToByteConverter jis0201 = CharToByteConverter.getConverter("JIS0201"); CharToByteConverter jis0208 = CharToByteConverter.getConverter("JIS0208"); CharToByteConverter ms932 = CharToByteConverter.getConverter("MS932");

    文字が特定のエンコーディングで変換可能かどうかを確認する - CLOVER🍀
    NetPenguin
    NetPenguin 2018/09/19
    文字コード
  • JIS漢字コード:JIS第一・第二水準―文字コード入門―

    JIS漢字コードとは? 日の文字コード規格は、財団法人日規格協会が日工業規格(いわゆるJIS規格)の一つとして選定・公布しています。 正式名称は「7ビット及び8ビットの2バイト情報交換用符号化漢字集合」になります(日規格協会の該当規格情報JIS X 0208の規格表・JIS X 0213の規格表)。もともとはJIS C 6226として制定されましたが、JISの情報部門の新設に伴ってJIS X 0208に規格番号が移動しています。 面区点番号 JIS漢字コードは、94×94のマス目を持つ二つの文字表で構成されています。前者を「第一面」、後者を「第二面」と呼びます。各表のマス目は94の区と94の点に分けられ、それぞれのマス目に一つの文字が収録されます。JIS漢字コードに収録される文字は、全て面・区・点の番号で個別に表現されます。 第1面-1区~7区(非漢字区画) ひらがな・カタカナ・記

    NetPenguin
    NetPenguin 2018/09/19
    文字コード
  • http://charset.7jp.net/jis.html

    NetPenguin
    NetPenguin 2018/09/19
    文字コード
  • Javaにおける文字コードまわりの話 - あしのあしあと

    毎度毎度、文字コードの話は面倒である。開発のメインストリームでないことと、外部調整が必要であることが原因だと思う*1。 プラットフォームが変わるたびに、毎回検証しているような気がする。私の場合だと、毎回OSが違う。Windows Server、AIX、HP-UX、Red Hat Linux。毎回Java仮想マシン(JVM)が違う。SunのJDK(今はOracleか)、JRockit(これもOracleか)、IBMのJVM、HPのJVM。データベースエンジンは、だいたい同じ。 当にみんな、毎回やっているのだろうか? とりあえず、Javaで開発することは決まっている前提で、外部設計と内部設計にて、やるべき(と思っている)ことをまとめておく。 以降で挙げる例は、次のようなシステムをイメージしている*2。 構築対象システム Webアプリケーション バッチ 外部システム ホスト 外部設計 画面や帳

    Javaにおける文字コードまわりの話 - あしのあしあと
    NetPenguin
    NetPenguin 2018/09/19
    文字コード
  • Unicode対応 JIS X 0208 文字コード表

    Unicode対応 JIS X 0208 文字コード一覧 JIS X 0208 の区点番号、JISコード、シフトJISコード、EUCコード、Unicode(UTF-8, UTF-16)の文字コード対応一覧です。 文字コードとその文字を順に出力しているだけですので、表示される文字はフォントによって決まります。 01区~08区 JIS非漢字(各種記号、英数字、かな) 13区~13区 NEC特殊文字(機種依存) 16区~47区 JIS第1水準漢字 48区~84区 JIS第2水準漢字 文字コードについてのページや、文字コード一覧についての説明もあります。 JIS X 0208 JIS非漢字 文字コード表 区 点 JIS SJIS EUC UTF-8 UTF-16 字 01 01 2121 8140 A1A1 E38080 3000 01 02 2122 8141 A1A2 E38081 3001

    NetPenguin
    NetPenguin 2018/09/19
    文字コード、JIS、SJIS、EUC、UTF-8、UTF-16 対応表
  • JIS X 0212 と JIS X 0213

    JIS X 0208:1987(87JIS)には6,879の文字、記号が登録されている。だが、これでは表しきれない文字が多いことから、6,067の文字、記号が追加された JIS X 0212(JIS補助漢字)が制定される。ところが、JIS補助漢字はコンピュータ向けに符号化することを想定していなかったため普及せず、2000年(平成12年)に制定される JIS X 0213 を待たねばならなかった。 97JISには6,879の文字、記号が登録されている。だが、これでは表しきれない文字が多いことから、田嶋一夫ら国文学研究資料館の研究に基づき、6,067の文字、記号が追加されることになった。1990年(平成2年)10月1日、「情報交換用漢字符号-補助漢字」として JIS X 0212 を制定した。別名は JIS補助漢字。 JIS X 0212 は JIS X 0208 と同じく、94×94の区点コ

    NetPenguin
    NetPenguin 2018/09/19
    文字コード