タグ

utfとbomに関するkiyo_hikoのブックマーク (4)

  • PowerShellを使用して、BOMなしでUTF-8でファイルを書き込む

    kiyo_hiko
    kiyo_hiko 2023/02/27
    ”Out-File UTF-8を使用するとBOMを強制するようです" → "これはUTFではないだろうと思っていましたが、…単純なソリューションを見つけました Get-Content path/to/file.ext | out-file -encoding ASCII targetFile.ext" ASCIIなら…これでいいな
  • UTF-8のBOM「あり」と「なし」 - 現在UTF-8はBOM「あり」と「なし」のどちらが主流なのでしょうか?将来的にはどうなりますか... - Yahoo!知恵袋

    UTF-8 のBOM「あり」と「なし」 現在UTF-8はBOM「あり」と「なし」のどちらが主流なのでしょうか? 将来的にはどうなりますか? 「BOMなしだと受け付けないソフトがある」という話がある一方で、「BOMありだとエラーになる」なんていう話もききます。 今後htmlファイルやスクリプトをUTF-8で統一しようと思っているのですが、BOMあり、なしのどちらを選べばよいのか迷っています。

    UTF-8のBOM「あり」と「なし」 - 現在UTF-8はBOM「あり」と「なし」のどちらが主流なのでしょうか?将来的にはどうなりますか... - Yahoo!知恵袋
    kiyo_hiko
    kiyo_hiko 2017/04/12
    "例えば、PHPを記述する場合、ファイル先頭にPHP開始タグを書いてもBOMがあるとPHPが始まる以前にHTTPヘッダを送ってしまうので、スクリプトでクッキーやセッション、別のヘッダを送ろうと思っても出来ません"
  • JScriptをUTF-8で書きたい

    コマンドラインで実行するJScriptをUTF-8で書きたいという、どうかしてる欲求が湧き上がりました。 とりあえずやってみようと、ファイルのエンコードをUTF-8にしてスクリプトを書いてみます。 test.js WScript.Echo("ほげ"); 実行結果:Microsoft JScript コンパイル エラー: 終了していない文字列型の定数です。 ダメです。マルチバイトを上手く解釈してくれません。弱った。 そういえば、wsfならエンコードを指定できます。試してみましょう。 test.wsf <?xml version="1.0" encoding="utf-8" ?> <package> <job> <?job error="True" debug="True" ?> <runtime/> <script language="JScript"> <![CDATA[ WScript.

    kiyo_hiko
    kiyo_hiko 2014/03/15
    JScriptだとBOMつけるのか 参考になる
  • JavaでUTF-8のBOMに対処する - 万象酔歩

    この記事は「 Javaでファイルオープン:文字コードや追加モードなど」の補助記事です。 JavaでBOM付きUTF-8ファイルを読む 媒体上の文字コード規格、UTF-8には、規格策定者の迷いのため 一時期、先頭に3バイトのBOMと呼ばれる、バイト並び識別マーク を置く仕様がありました。 現在はBOMはまず使われることはありませんが、Windows付属の「メモ帳」という 簡易エディタでUTF-8ファイルをうっかり作成してしまうと、ファイル先頭に BOMが付いてしまいます。 残念なことにJavaではBOM付きのUTF-8ファイルをまともに 読むことができません。 先頭がBOMの場合スキップする方法 対処法は色々考えられますが、ここでは、BufferedInputStreamを被せ、 先頭がBOMの場合スキップし、BOMでない場合先頭まで巻き戻す形を 示します。 import java.io.*

    JavaでUTF-8のBOMに対処する - 万象酔歩
    kiyo_hiko
    kiyo_hiko 2013/08/28
    「BOMはまず使われることはありません…メモ帳という 簡易エディタでUTF-8ファイルをうっかり作成してしまうと…BOMが付いてしまいます。残念なことにJavaではBOM付きのUTF-8ファイルをまともに 読むことができません」
  • 1