概要 BOM(Byte Order Mark)とは、Unicodeで記述された文書の冒頭に記載される短い符号で、使用されている文字符号化方式(文字エンコーディング)の種類や、そのバイト順(エンディアン)を指定するためのもの。 文書がUnicode文字列であることを示したり、一文字を複数バイトで表す際のバイト列の並び順(上位側が先か下位側が先か)を規定する。符号化方式によって2~4バイトのバイト列が決められており、BOMを記述しないよう規定された符号化方式もある。 UnicodeにはUTF-8やUTF-16など複数の符号化方式が規定されており、同じ文字でも符号化方式が異なれば違うバイト列で表現される。また、例えば同じUTF-16でも、機種や処理系の違いによって、ある文字を表すバイト列を上位バイトが先頭側になるように並べる(ビッグエンディアン)か、下位バイトが先頭側になるように並べる(リトルエ