external-format の使い方がわかったところで、実用的には文字コードの判定処理が必要になる場合が多い。 external-format を知っただけでは、with-open-file の external-format に何を指定すればいいのか迷ってしまう。 で、いろいろ蘊蓄を語ろうと思ったのだが、ふと Gauche の文字コード判定処理を CL に移植して比較したところ 性能、精度とも私の手作りのものより断然よかったのでこっちを採用。 Gauche のソースの ext/charconv/guess.scm, ext/charconv/guess.c, ext/charconv/guesstab.c が日本語エンコーディング判定処理だ。 guess.scm で状態表 guesstab.c を出力し、 C コンパイラで guess.c guesstab.c をコンパイルしてモジュ
CJK統合漢字(シージェーケーとうごうかんじ、英: CJK unified ideographs)は、ISO/IEC 10646(略称:UCS[1])およびUnicode(ユニコード)にて採用されている符号化用漢字集合およびその符号表である。CJK統合漢字の名称は、中国語(英: Chinese)、日本語(英: Japanese)、朝鮮語(英: Korean)で使われている漢字をひとまとめにしたことからきている。 CJK統合漢字の初版であるUnified Repertoire and Ordering第二版は1992年に制定されたが、1994年にベトナムで使われていた漢字も含めることにしたため、CJKVと呼ばれることもある。CJKVは、中国語・日本語・朝鮮語・ベトナム語(Vietnamese) を表す英語の頭文字である。特にその四つの言語で共通して使われる、または使われていた文字体系である漢
CJK互換漢字(シージェーケーごかんかんじ、英語: CJK Compatibility Ideographs)は、Unicodeのブロックの一つであり、Unicodeの統合規則に従うなら本来CJK統合漢字に統合されるはずであるが、既存の文字コードとの互換性のためUnicodeに収録された互換文字の一種である。 文字コード順ではなく、登録された順に紹介する。 U+F900 - U+FA0B 韓国の文字コード規格KS X 1001(収録当時の規格番号はKS C 5601)に含まれる重複漢字との往復変換を保証するために収録された漢字。 KS X 1001では漢字を韓国語での辞書順に配列しているが、一部の漢字には複数の読みが存在する。KS X 1001は同じ形でも複数の読みを持つ漢字は分離して収録しているため、これらは統合されて統合漢字に収録された。 韓国はこれらの文字に対して原規格分離を主張しな
ところで、常用漢字表の改定を審議する漢字小委員会や文化庁の人々は、「情報化時代の文字」についてどのように考えているのだろう? まさかとは思うが、「読めるだけでいい漢字」(第1部第3回参照)を常用漢字表に追加すれば「情報化時代」に対応したことになると思っているのだろうか。あるいは、Webや電子掲示板の漢字使用頻度(第1部第2回参照)を調査しただけで、「情報化時代の文字」の実態がつかめると思っているのだろうか。 ここまで5回にわたり、漢字小委員会がどのように常用漢字表を改定しようとしているのか、具体的な審議経過をたどりながらお伝えしてきた。そこで明らかになったように、改定の理由は「情報化時代」の到来――パソコンや携帯電話等の爆発的ともいえる普及により、人々の間で「文字を書く」ことがキーボード等で「文字を打つ」ことへと変わってきたというような、書記環境の激変に対応しようとするものだった。 では、
彼等は必死に抵抗しようとしている。「新常用漢字表(仮)」(以下、この連載では新常用漢字表と略)を審議する漢字小委員会を傍聴していると時折そう感じる。何に? ここ10年顕著になったパソコンや携帯電話の爆発的な普及と、それにともなう人々の急激な変化にだ。巨大なうねりとも言える社会全体のIT化により、私たちにとって「文字を書く」とは、紙に書くより情報機器を操作することを指す方が圧倒的に多くなっている。その状況は今後、進むことはあっても決して無くなることはない。影響は私たちの暮らし全体に及んでおり、すでに誰にも否定できない現実となっている。 国語施策の根本である常用漢字表が制定されたのは1981年、すでに27年もの歳月が流れている。今回の改定はその間に起きた「書く」環境の急激な変化に対応しようというものだ。常用漢字表は法令や公用文を書き表わす場合の指針になっており[*1]、改定されれば官公庁は新し
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く