タグ

ユニコードに関するdenkenのブックマーク (2)

  • 「者」の点はいつ消えたのだろう: 極東ブログ

    書棚の奥のを取ろうとしてぼろっと「日の漢字・中国の漢字」(参照)が落ちてきた。戻す前にぱらとめくったが運の尽き。そういえば、と少し考え込んでしまった。「者」という漢字について。 現在の漢和字典は、字解のあとに熟語を掲げて解説するとき、その字が語頭にある語だけ並べる。このやりかたで行くと、例えば「者」という字のように、それが語頭に立つ熟語例を見ないものについては、説明が一字の説明だけに終わることになる。その結果、この字の説明は、とかくむずかしく、中国語や漢文訓読によほど通じた人でなければ理解がむずかしいものになる。 というわけで、あるべき説明の試みが続く。一読、なるほどねとも思うし、これは違うんでないのとも思う。いずれにせよ、こういう解説はスポラディックにやってもなとは思う。 gooの辞書で「者」を検索すると、わけわかんないにはなる。 しゃ 【者】 〔「其者(それしや)」の略〕その道の者

  • Unicode::Normalize で遊ぶ - daily dayflower

    Unicode の規格では,文字の合字(リガチャ等)等を統一的に扱えるように,「正規化」という処理が仕様として定まっています。この正規化処理のうち「互換性分解」という処理を行うと副作用として半角カナを全角カナに変換できます(逆に全角カナ→半角カナはできません)。 #!/usr/bin/perl use strict; use utf8; use Encode; use Unicode::Normalize; my $src = 'ポンジュース'; my $dst = Unicode::Normalize::NFKC($src); print Encode::encode('utf8', "${src} => ${dst}\n"); # OUTPUT is: ポンジュース => ポンジュースUnicode の正規化についてはperl5.8のUnicodeサポート および http:/

    Unicode::Normalize で遊ぶ - daily dayflower
    denken
    denken 2006/06/24
    「この正規化処理のうち「互換性分解」という処理を行うと副作用として半角カナを全角カナに変換できます(逆に全角カナ→半角カナはできません)。」
  • 1