Unicodeに関するhisamakiのブックマーク (2)

  • UTF-8の文字コード表 - 備忘帳 - オレンジ工房

    UTF-8の文字コード表なのです。いつも検索して、よそ様のページを参照させていただいていたのですが、面倒なので自分で作りました。 perlのスクリプトでガーッと出したので、見栄えはアレですが、とりあえず。 1バイト文字 2バイト文字 3バイト文字 E2 9C 80 ~ Dingbats、昔からある記号、絵文字とか E3 80 80 ~ 全角ひらがな・カタカナ EF BC 80 ~ 全角英数字、半角カナ 4バイト文字 F0 9F 8C 80 ~ たぶん今どきの皆さんの言う絵文字 F0 9F 98 80 ~ 顔文字 更新履歴 (2018-05-10 追記) コード表を全体的に再出力しました。変更点は以下の通りです。 unicode追加面、4バイト文字の表もつくりました。 各文字ブロックにタイトルを付けました。英語タイトルはUnicode仕様書PDFへ直リンクしています。 表示されてないけど、ど

    hisamaki
    hisamaki 2009/07/05
    ネ申..._φ(゚∀゚ )アヒャ
  • FileFormat.Info · The Digital Rosetta Stone

    FileFormat.Info is the source for file format standards, online file conversions, and detailed file specifications, including Unicode characters, MIME types and file extensions

    hisamaki
    hisamaki 2009/02/13
    ある文字がどのUnicodeサブセットに所属するかとか解る
  • 1