タグ

unicodeに関するCaligariのブックマーク (2)

  • バイト順マーク - Wikipedia

    プログラムがテキストデータを読み込む時、その先頭の数バイトからそのデータがUnicodeで表現されていること、また符号化形式(エンコーディング)としてどれを使用しているかを判別できるようにしたものである。[1] Unicodeが開発された当初は、アメリカではASCII、ヨーロッパなどではISO-8859、日ではShift_JISやEUC-JPといった他の文字コードが主流であり、使用されている符号化方式がUnicodeのものであることを明示する必要があった。また、Unicodeの符号化方式は複数あり、特にUTF-16やUTF-32にはそれぞれエンディアンが異なる2種類があるため、符号化方式同士を区別する必要があった。その方法として、先頭のデータにテキスト以外のデータを入れることが発案された。 実際にBOMを使用すべきか、あるいは使用すべきでないかは、Unicodeを利用したより上位の仕様に

    Caligari
    Caligari 2016/09/07
    無いと開いたとき文字化けするよな。おかしな事いって
  • Hanazono fonts

    English document is below. (click to download Hanazono font at osdn.jp) 下面有中文。(在osdn.jp下载“花园字库“) 現在公開されている花園明朝:2017年09月04日版 ダウンロード 花園明朝(HanaMin) (osdn.jp) 花園フォントについて このフォントは自由かつ無償の漢字フリーフォントです。非漢字は一部のみ含まれます。現在は明朝体フォント1ウェイトが提供されています。フォントの生成にはKAGEシステム、Clipper, FontForgeおよびTTXを利用しています。 収録されているグリフはすべてグリフウィキに登録されているデータを利用しています。このデータは、グリフウィキに登録ユーザーとして、あるいは匿名ユーザーとして漢字字形データを登録・改良してくださった多数の方々によるボランティアの活動から成

  • 1