エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
“情報化時代”に追いつけるか? 審議が進む「新常用漢字表(仮)」: 第2部 新常用漢字表と文字コード規格第6回 重複符号化を排除するUnicode正規化と互換漢字
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
“情報化時代”に追いつけるか? 審議が進む「新常用漢字表(仮)」: 第2部 新常用漢字表と文字コード規格第6回 重複符号化を排除するUnicode正規化と互換漢字
● 「分解した形」も「合成ずみの形」も「同じ字」 1990年3月、UCSと一本化する1年半前。まだ草案段階だ... ● 「分解した形」も「合成ずみの形」も「同じ字」 1990年3月、UCSと一本化する1年半前。まだ草案段階だったUnicodeは、自らの生き残りをかけて大きな変更を加える。当初からの合成列用の発音記号(結合文字)に加えて、新たに事前に発音記号を合成した文字を収録することにしたのだ。この結果、まことに面倒なことだが、Unicodeには見た目は「同じ字」なのに符号位置は「違う字」が含まれることになった。前回も述べたが一般に文字コード規格ではこれを「重複符号化」と言って嫌う。文字コード規格の本質は、ある文字の形に固有の符号に対応付けるところにあるからだ。これも互換漢字と同様、後発規格としてのUnicodeの宿命かもしれない。 これを実際の使用状況で考えてみよう。合成列と合成ずみ文字の両者が混在しているファイルがあったとして、これに対して検索をかけた場合、ユーザーが期待するのはどういう結果だろう?