タグ

文字コードに関するyamada55のブックマーク (3)

  • HTML文書は文字エンコーディングUTF-8でなければなりません - 水底の血

    さよならレガシーエンコーディング。 文字エンコーディング宣言が存在するかどうかにかかわらず、文書のエンコードに使用される実際の文字エンコーディングはUTF-8でなければならない。 4.2.5.5 文書の文字エンコーディングを指定する - HTML Standard 日語訳 Require utf-8 when specifying character encoding by sideshowbarker · Pull Request #3091 · whatwg/htmlにより、HTMLで使用できるエンコーディングはUTF-8のみとなりました。これにより、古いHTMLでは許容されていた、Shift_JIS、ISO-2022-JP、EUC-JP、UTF16LEといった文字エンコーディングは適合するHTMLではなくなりました。すでにNu Html CheckerでUTF-8以外の文字エンコー

    HTML文書は文字エンコーディングUTF-8でなければなりません - 水底の血
  • PowerShell/ファイル操作/テキストファイルの入出力と文字コード - yanor.net/wiki

    テキストファイルの入出力と文字コード 前提 PowerShellは文字列を(バイト列ではなく)文字列として認識する PS> (echo "こんにちは").GetType() IsPublic IsSerial Name BaseType -------- -------- ---- -------- True True String System.Object PS tmp> (echo "こんにちは").Length 5 PowerShellの内部文字コードはUTF16 echo "こんにちは" > utf16.txt PowerShellの内部文字コードはUTF16(UTF16LE)。 従って、コマンドレットの出力をリダイレクトでファイルにすると標準ではUTF16で保存される。 日語PowerShellのデフォルト文字コードはSJIS 日語PowerShellのデフォルト文字コード

  • 日本語の横棒記号に絶望した – taichino.com

    先日のjcconvは記号の全角半角変換も実装しているのですが、マイナス記号が上手くマッピング出来ていませんでした。調べてみるとマイナスだと思っていた記号が全角ダッシュ(EM DASH)だった訳です。イラッとしたついでに横棒記号について調べてみました。結果としては日語には思ったよりたくさんの横棒記号がありまして、イライラが収まりません。 まず半角記号の’-‘はハイフンマイナス(0x2d)と呼ばれていて、ハイフンとマイナスの意味を包含した記号になっています。ASCIIコードのビット数の制限があった事を考えても、センスの良さが光る決定だと思います。文脈でハイフンかマイナスかは容易に判断できる訳です。ハイフンとマイナスを別々にしていたら、今頃マイナスのつもりで書いたハイフンに対するコンパイルエラーで世界中のプログラマのイライラは100%水増しと言った状況なわけです。世界平和に繋がっているといって

  • 1