タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

UTF-8に関するraiga448のブックマーク (1)

  • ほぅほぅじょせつ : UTF-8とUTF-8Nの違いによるワナ

    2008年02月27日08:32 カテゴリ UTF-8UTF-8Nの違いによるワナ rubyを書いているのだが、結構意外なところではまって、時間を費やしてしまったのでメモしておく。 どうやらUTF-8にはUTF-8UTF-8Nの2種類がある。それらの違いは、UTF-8ではBOM(Byte Order Mark)と呼ばれる、エンディアンを判定するためのデータが先頭3バイトに書き込まれ、UTF-8Nでは書き込まれないというもの。 (追記20080401:コメントでご指摘をいただいたように、上の表記は適切ではありません。正しくは「UTF-8」では基的にBOMは付与されず、BOMが付与された場合に限り「UTF-8BOM」などの表記を与えて区別するべきであるようです。wikipadia「UTF-8」 来であればすべての表記を変更すべきですが、ここではTerePadがBOMつきのUTF-8を「

    raiga448
    raiga448 2010/08/18
    まさか、UTF-8に種類があるとは知りませんでした;
  • 1