Sign in to iCloud to access your photos, videos, documents, notes, contacts, and more. Use your Apple ID or create a new account to start using Apple services.
川幡太一の『CSSにおける文字とフォント』を聞きながら思ったのだが、結局のところ日本は、Unicodeにおける漢字統合に、いまだ納得していないということなのだろう、と、今更ながら思いあたった。すなわち「神」と「神」に、同じ文字コードが割り当てられているのが、我慢ならないのだ。その結果、「U+795E」と「U+FA19」とで分けてみたり、「U+795E U+E0101」と「U+795E U+E0100」とで分けてみたり、何らかの方法で分けたい、ということになってしまっているわけだ。 でも、単に「分けたい」と言ってもJTC1/SC2/WG2は聞いてくれなかったので、JIS X 0213を理由にしてみたり、人名用漢字を理由にしてみたり、旧字による出版印刷を理由にしてみたり、戸籍統一文字を理由にしてみたりしてしまった。その結果「分ける」理由によって、異なるアプローチが起こってしまった。互換漢字とか
概要 『漢字データベースプロジェクト』は、Unicode / UCS (Universal Multiple-Octet Coded Character Sets) によって符号化された漢字(CJK統合漢字)の情報交換・検索照合・分析に役立つ様々なデータベースを整備することを目的に、2003年度に日本学術振興会科学研究費補助金・研究成果公開促進費(データベース)の援助を受けて開始しました。 各種漢字データファイルは、GitHubにて管理されており、GitHubサーバから取得することができます。 ライセンスについて 本プロジェクトのデータは、GPLライセンスおよびMITライセンスにて配布しています。 GPLライセンスによる配布 IDSデータ(ids.txt) 説文解字注(六書音均表等を含む)データ 宋本廣韻データ 學生字典データ MITライセンスによる配布 上記以外のすべてのデータ(以下を含
「改行に注意!」でも改行に関して触れる機会がありましたが、ここでは改行を別な観点から考えてみます。 下のテキストアリアに2行の文章が入っています。「文字数」ボタンを押してみて下さい。 Windows なら、「22字」という答えが表示されるはずです。 入っている文字は20しかないのに、22になるのは、改行コード分が含まれるからです。しかし、なぜ22なのでしょう? その理由は、Windows などでは CR(carriage return「復帰」)と LF(line feed「行送り」)という2つの制御コードの組み合わせで改行を表しているからです。 それぞれ1バイトで計2バイトとなります。「復帰」というのは元々、行頭に戻ることを意味し、「行送り」は次の行に移ることを意味していました。 つまり或る行の終わりで行頭に帰り、次の行の頭に移るということです。 しかし現在のパソコンでは、この区別は必ずし
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く