タグ

unicodeに関するsatoshieのブックマーク (3)

  • Windowsのシステムロケール「日本語(日本)」はやっぱり特殊?

    Windowsにまつわる都市伝説 「©」はUnicodeなのにUnicodeではない? [参考]真夏の怪異、ログオン中のユーザーが1人少ない! それは「Shift-JIS」の呪い?(連載 第189回) WindowsのNTFSファイルシステムは、MS-DOSや16bitアプリケーション向けに、「8.3(8dot3)」形式の短いファイル名を自動生成する互換機能を提供しています。とある、有名なWindowsの専門書籍(英語)には、その生成方法が説明されています。 例えば、スペース(空白)やUnicode文字など、MS-DOSで使えない文字、前後のピリオド、最後のピリオドを除く埋め込まれたピリオドを削除するなどです(この後に3つの手順が続きます)。 書籍に例示されているファイル名で実際にファイルを作成し、「DIR /X」コマンドで8.3形式の短いファイル名を確認してみたところ、3つの例外を除い

    Windowsのシステムロケール「日本語(日本)」はやっぱり特殊?
  • 文字列を反転させたい|nona

    こんにちは。徒然なるままにTweetを眺めていたら、Tanakaさんがこのようなことを呟いていました。 そういやRustのStringにreverseメソッドないなと思ったけど、まあよく考えたらUTF-8で文字逆転させるとか地獄のような話になるしそもそも長さが変わるケースとかあったりしそうで怖いわな・・・(´・_・`) — Hideyuki Tanaka (@tanakh) May 1, 2021 背景等はよくわからないですが、文字列の反転というのは確かに難しい問題ですし、どう難しいのかというのを、ちょっと真面目に考えて解説してみました。というノートです。 文での表記についてこれから文字とそのバイト表現の話をしていきます。文字のエンコードの方式で同じ数値でも色々意味が分かれてしまいますので、文では以下のように表記することにします。 Unicodeコードポイント(以下、単にコードポイント

    文字列を反転させたい|nona
  • 新元号「令和」と文字コード(主にUnicode)の問題

    境 真良@iU/GLOCOM/METI(あーりん推し/芸能人スキャンダル要らない) @sakaima 「令和」ですが、「令」はUnicode「U+4EE4」、UTF-8だと「E4 BB A4」、シフトJISだと「97DF」、また「和」はUnicode「U+548C」、UTF-8で「E5 92 8C」、シフトJISだと「9861」です。とりあえずご参考まで。 #さてお仕事ですよ 2019-04-01 11:46:49

    新元号「令和」と文字コード(主にUnicode)の問題
  • 1