関連タグで絞り込む (1)

タグの絞り込みを解除

UTF-8に関するtak-zoのブックマーク (5)

  • UTF-8

    UTF(Unicode Text Format)はUnicodeのテキストをデータとして入出力する時 に用いるフォーマットです。 UnicodeコンソーシアムではUTF-7, UTF-8, UTF-16の3種類のUTFを定義してい ますが、Javaではこの中のUTF-8を採用しています。 UTF-8の最大の特徴はASCIIコードは、まったく同じエンコーディングが行われ ることです。 つまり通常のASCII文字列に対してUTF-8を使用した入出力を行うことができる わけです。 ファイル名やドメイン名などASCIIコードの範囲で定義される文字列の入出力 に向いているといえるでしょう。 java.io.DataInput、java.io.DataOutputにデータ入出力にUTF-8の入出力機能が定義されています。 UTF-8のコード ビット列 内容

    tak-zo
    tak-zo 2006/12/28
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • UCS-2とUTF-8

    最終更新 2003-11-11 UCSとUTF ユニコードで文書を作るとき,文字コードの方式が2種類,あるいはそれ以上あることに気が付かれるかもしれません。例えば,一つはUnicodeとあるのに対し,もう一つはUnicode (UTF-8)と表記されているかもしれません。この2つは,また,その違いは何でしょうか(前者はUTF-16の一形態なのですが…)。 UCS-2とUCS-4 ユニコードが採択されることになった多言語用の文字コードセット,ISO-10846-1は,16ビット(16桁の二進数)でそれぞれの文字を表します。それをUCS-2 (Universal Character Set coded in 2 octets,「2つのオクテットでコードされたユニバーサル文字セット」)と称します。オクテットとは文字長の単位としての8ビット(8桁の二進数)のことです。 ユニコードの特定の文字は,例

  • ATMARK

    133.242.243.6 / HatenaBookmark/4.0 (Hatena::Bookmark; Analyzer)

  • Yu TANAKA's Works:S-JISからUTF-8への変換

    UTF-8 というステップを踏めばよい。因みに、ここで変換されるUTF-8には先頭 3バイトのBOM(Byte Order Mark)はつかない(UTF-8Nと呼ばれることも ある)。よって、そのままJADやMANIFESTに利用可能 (UTF-8UTF-8Nの違いについては こちら を参照下さい[2002/10/29])。 ■変換関数例 最初にコンバートしたデータを格納するのに必要な 容量を調べて、その分の容量を確保してコンバートし、そのデータを 引数で与えた領域に収まる分だけコピーしている。S-JISもUTF-8もNULL 終端。 //--------------------------------------------------------------------------- // doconv() //! 実際の変換処理。 /*! \param ssrc [i] 変換元の文

  • 1