タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

文字コードに関するkeibontrakunのブックマーク (65)

  • 漢字コードについて - とほほのWWW入門

    コンピュータの内部では文字を数値として扱います。例えば 'A' という文字には65(16進数で0x41)というコードが割り当てられています。これを文字コードと呼びます。アルファベットや数字などのいわゆる半角文字は1バイト(8ビット)で表すことができますが、日語の漢字を含む文字コードは最低でも2バイト(16ビット)を必要とします。この、漢字を含む多バイト系のコードを漢字コードと呼びます。(実際にはひらかな、カタカナ、全角英数字も含まれるので漢字コードという呼び名は適切ではないのですが...) 現在主に使用されている文字コードの体系として以下のものがあります。 ASCIIコード ... いわゆる半角英数文字 JISコード ... 電子メール転送などに使用 シフトJIS ... 主にWindowsMacintoshで使用 EUC ... 主にUNIXで使用 Unicode ... 日ではま

  • tconv "Text Encoding Converter with XML support" Version 0.5

    ソフトウェアの更新日付: 1999年7月20日 ソフトウェアの著作権表記: Copyright (c) 1999 by Pie Dey Co.,Ltd. ここは、tconv "Text Encoding Converter with XML support" Version 0.5に関する情報を提供するページです。tconv "Text Encoding Converter with XML support" Version 0.5は、 株式会社ピーデー の川俣 晶 (autumn@piedey.co.jp)が開発し、フリーソフトウェアとして公開しているソフトウェアです。 概要 テキストファイルのテキストエンコーディングスキームを変換します。 明示的な指定の他に、XML宣言を利用してソース側エンコーディングを判定するXMLモード、E-Mailメッセージのヘッダー情報でエンコーディングを判定

  • Unicode::Japanese - 日本語文字コード変換

    NAME SYNOPSIS DESCRIPTION METHODS UNICODE MAPPING BUGS AUTHOR COPYRIGHT NAME Unicode::Japanese - 日語文字コード変換 SYNOPSIS use Unicode::Japanese; # convert utf8 -> sjis print Unicode::Japanese->new($str)->sjis; # convert sjis -> utf8 print Unicode::Japanese->new($str, 'sjis')->get; # convert sjis(imode絵文字) -> utf8 print Unicode::Japanese->new($str, 'sjis-imode')->get; # convert 全角(utf8) -> 半角(utf8) prin

  • 第1回:進まないJIS2004への移行,その原因は?

    2004年に制定された最新の文字コード規格「JIS X 0213:2004(通称:JIS2004)」。このJIS2004に対応したWindows Vistaがリリースされて,早1年が経過した。JIS2004自体は,フォントやIMEの普及に合わせて,ユーザーに順調に浸透している。しかし,ユーザーからのデータを受け取る企業情報システムの側では,JIS2004への対応が進んでいないのが実情だ。なぜJIS2004への対応が進まないのか。その現状をまとめてみよう。 JIS X 0213:2004(JIS2004)は,2004年に制定された最新の文字コード規格。過去の文字コード規格に対して多くの文字を追加しており,従来扱えなかった日の地名・人名などが表現できるようになった(JIS X 0213の概要や,2004年に改訂された経緯については,ITproの記事「VistaでUnicode以外の選択肢はな

    第1回:進まないJIS2004への移行,その原因は?
  • DOMAIN ERROR