ブックマーク / ykakinoki.hateblo.jp (1)

  • UTF-8 の BOM について - 将棋プログラミング

    1.はじめに UTF-8 の文字コードのファイルには、BOM (Byte Order Mark) がある場合とない場合がある。 Unicode の規格では、BOM は、推奨されないが、許容されている。 ja.wikipedia.org 今回、必要があり、色々な OS や言語で、UTF-8 の文字コードのファイルを作成した時、BOM が記録されるか、されないか、を調べた。 2.色々な OS や言語での BOM 2.1 Windows 10, Visual Studio, C++, _wfopen (_tfopen), // Visual Studio 2005 以降 保存 FILE *fp = _wfopen(name, _ L"w, ccs=UTF-8"); if (fp == NULL) { // エラー処理 } fwprintf_s(fp, L"ABC漢字123\n"); fclose

    yorkfield
    yorkfield 2024/06/15
    Windowsは既存文字コードのテキストとUnicodeテキストをBOMで区別する。BOM有りで統一できるなら確実な区別手段ではある。
  • 1