(閉じる)

タグ :

コンピュータ・IT 87 users このエントリーをはてなブックマークに追加

UTF-8 - Wikipedia

UTF-8(旧UTF-2)はUCS(ISO/IEC 10646)、Unicodeで使える符号化方式。 正式名称は、ISO/IEC 10646では'UCS Transformation Format 8'、Unicodeでは'Unicode Translation Format-8'という。 両者はUCS-4とUnicodeコード重複範囲で互換性がある。 2バイト目以降に'/'などのコードが現れないように工夫されていることから、'UTF-FSS'(File System Safe)ともいわれる。 RFCに... > このページを見る

最終更新時間: 2005年07月27日04時13分
▼ブログで紹介する

みんなのブックマーク 人気(0) 新着

  • エンコード体系がなんか再帰的っぽくて楽しい。 2012/03/07
  • 実行可能スクリプトでバイト順マーク(BOM)がついているとシェバング(#!)が機能しない。 2012/01/18
  • ChromeでBOMの有無でつまった 2011/09/22
  • なお、1バイトが9ビットである処理系では、この問題をあまり発生させずに符号化できるはずである。このアイディアに基づいたジョークRFCがRFC 4042 “UTF-9” として2005年4月1日に公開された。 2010/12/26
  • Unicodeによる定義[5]とIETF による最新の定義[6]では、5〜 6バイトの表現は不正なシーケンスである。 2010/07/12
  • 「なお、1バイトが9ビットである処理系では」 ←本題じゃないけどあるのかそんなの。「1バイト=8ビット」は辞書的な定義だと思ってたよ。 2009/11/20
  • UTF-8NとかUTF-8-MACとかあるのか よくわからん。。。 2009/11/20
  • へー >BOMありの方をUTF-8、なしの方をUTF-8Nと呼ぶこともある 2009/10/28
  • ASCIIと同じ部分は1バイト、その他の部分を2〜6バイトで符号化する。4バイトのシーケンスでは21bit(0x1FFFFF)まで表現することができるが、Unicodeの範囲外となる17面以降を表すもの(U+10FFFFより大きなもの)は受け付けない。また5 2009/10/26
  • 漢字・かなは,UTF8では3バイト。ASCIIは1バイト。最大6バイト 2009/09/04
  • BOMとか日本語は4バイトだったりとかの話。 日本語3バイトは知ってたけど4バイトもあったのか…。 2009/01/13
  • cxx cxx
    "BOMありの方をUTF-8、なしの方をUTF-8Nと呼ぶこともあるが、このような呼び分けは日本以外ではほとんど知られておらず、また公的規格などによる裏付けもない。" まじで 2008/11/05
  • 読む 2008/06/05
  • バイトオーダーマーク(BOM)「BOMありをUTF-8、なしをUTF-8Nと呼ぶこともある(ほぼ日本のみ)」BOMが余分なデータとみなされて問題となる場合もあれば、逆にBOMがないとUTF-8と認識できないプログラムも存在する 2008/04/28
  • 「UTF-8のBOMを認識しないプログラムでは、BOMが余分なデータとみなされて問題となる場合もある。逆にBOMがないとUTF-8と認識できないプログラムも存在する。」 2008/01/10
  • 文字コードのひとつ。「先頭バイトを容易に判定」できる、「文字列の検索を単なるバイト列の検索として行っても、文字境界と異なる個所でマッチしてしまうことがない。」などのメリットがある。 2007/12/25
  • 符号化のバイト数がどうなってるか知りたかった 2007/12/14
  • ][plagger]「プログラムでは、BOMがゴミとみなされて問題となる。 とくに、プログラミング言語やMakefileのように文法が厳密に決まっているものの場合、エラーになってしまう。」これがわからなくてplaggerで詰まった 2007/10/28
  • 文字境界の判別方法 2007/03/11
  • UTF-8がどういうデータ構造を持っているか。文字コードの判別処理に必要なものなので、覚えておこう 2007/02/28

このブックマーク一覧を非公開にするには?

はてなブックマークはオンラインでブックマークを管理・共有できる無料サービス。自宅、職場、外出先、どこからでも同じブックマークにアクセスできます。ユーザーはみんなでブックマークを共有して効率良く情報収集しています。あなたもはてなブックマークを始めてみませんか?

このエントリーを含むエントリー(31)

このエントリーを含む日記(47)