[B! UTF-8N] ext3のブックマーク

ext3 id:ext3

UTF-8Nに関するext3のブックマーク (3)

UTF-8 - Wikipedia
UTF-8（ユーティーエフはち、ユーティーエフエイト）はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位（1–4バイトの可変長）の文字符号化形式および文字符号化スキーム。正式名称は、ISO/IEC 10646では “UCS Transf ormation Format 8”、Unicodeでは “Unicode Transf ormation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある[1]。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。当初は、ベル研究所においてPlan
ext3 2012/09/04
UTF-8

Unicode

UTF-8N
リンク
UTF8 と UTF8N の違い - alpha @ ウィキ
UTF8 と UTF8N の違い UTF8：　 BOM （Byte Order Mark）付き UTF8N： BOM なし BOMとはUnicodeのエンディアンを示すものでテキスト・ファイルの先頭に置かれている。また、同時にテキスト・ファイルがUnicodeかどうかの判別にも使われることもある。中身は、U+FEFF である。これが、次のような形式の違いで、エンディアンを区別している。 FE FF：ビッグエンディアン（UTF-16) FF FE：リトルエンディアン（UTF-16) 00 00 FE FF：ビッグエンディアン（UTF-32) FE FF 00 00：リトルエンディアン（UTF-32) UTF-8の場合、エンディアンが関係ないので必要ないが付いているものがある。この場合、UTF-8 の BOM は EF BB BF UTF-8Nで保存すると、アプリケーションによ
ext3 2012/09/04
UTF-8

UTF-8N

Unicode

BOM

ビッグエンディアン

リトルエンディアン
リンク
utf8とutf8Nって？
ブログがお目見えしてから、utf-8という文字コードを初めて知った方は多いだろう。かくゆう私も、実はそうである。 unicodeの存在はおぼろげに知っていたが、MTでその存在が明らかになった。で、MTのutf-8は、正確にはutf-8Nである。 utf-8とutf-8Nの違いは、utf-8がBOMあり、utf-8Nはありません。 BOMとは、unicodeでファイルが保存されるときに、「このファイルはunicodeだよ」と判定できるために、ファイルの先頭につけるコードのことです。さらに知りたい人は、短時間でわかりやすいESRIジャパンのこちらを参考に。と小難しいことはさておいて、MTのカスタマイズに関わってくるutf8について。テンプレートを外部ファイルで保存した場合、エディタで保存するときに、（もちろん設定がutf-8の場合）（※文字コードが選択できるエディタ）「名前をつけ
ext3 2012/09/04
"utf-8とutf-8Nの違いは、utf-8がBOMあり、utf-8Nはありません。 BOMとは、unicodeでファイルが保存されるときに、「このファイルはunicodeだよ」と判定できるために、ファイルの先頭につけるコードのことです"UTF-8N駄目じゃん

Unicode

UTF-8

UTF-8N
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx