タグ

NFDに関するsks_hiroのブックマーク (5)

  • Macの合字ファイル名で困ったときにはUnicode::Normalizeで処理すべし - 狐の王国

    何やらMacな人から頂いたファイルだの自分のMacからDebianに持ってきたファイルだのが合字(リガチャ, ligature)になってることがあって、Debianのターミナルなんかでは正常に表示されなかったりする。 合字っていうのはWikipediaの合字の項目を見るとわかるけども、複数の文字が結合されたものね。 日語だと濁点や半濁点を、Macは合字として扱う。つまり「ぱ」ではなく「は゜」と2文字になってて、それを表示するときに1文字幅で表示させる(合字にする)わけね。 というわけでこれ処理するライブラリないのかなーとIRC相談してみたら、Unicode::Normalizeを使えとのお達しが。 From Cとか From Dとかよく意味がわからないんだけども、一緒に教えてもらったUAX #15: Unicode Normalization Formsをの図を見ると少し意味がわかった

    Macの合字ファイル名で困ったときにはUnicode::Normalizeで処理すべし - 狐の王国
  • Mac OS Xファイル名の正規化 - はこべにっき ♨

    Mac OS Xのファイル名の文字エンコーディングはUTF-8になってる。このファイル名をEUC-JPとかの他のエンコーディングに変換するときに、そのままだとおかしくなる。 どうも原因は、Mac OS Xではひらがなやカタカナの濁音や半濁音を表すのに、二つの文字を組み合わせるようにしているからのよう。EUC-JPではそれらの文字は一つの文字として扱うようにしているので、うまく変換できない。ためしに再現してみるのに、以下のようなPerlのコードを用意してみた。 use warnings; use strict; use Encode; use Unicode::Normalize; my $str = "スマイルギャング"; my $norm = decode_utf8($str); my $osx = NFD($norm); # 濁音を二つの文字を組み合わせて表す print encode

    Mac OS Xファイル名の正規化 - はこべにっき ♨
  • Tomorrow is another day: WinとMacの文字コード

  • 正規化 - odz buffer

    ref:ウノウラボ Unoh Labs: Mac OS X上のUnicode ref:はてなブックマーク - ウノウラボ Unoh Labs: Mac OS X上のUnicode 符号化方式と正規化の問題を激しく混同した解説をどうも。ブックマークコメントをみても正しく問題が伝わっていないように思える。というか、書いた人がきちんと認識してないんじゃないか。 2007年09月04日 omaya omaya 誰が悪いんだろう。 強いて言えば NFD な Unicode の入力に対してまともに動かない Web アプリじゃないかな。 2007年09月04日 mattn mattn macosx, unicode ブラウザのバグだしバージョンで処理しないといけないのかな... ブラウザのバグではない。 しかもややこしいことに、UTF-8で濁点をあらわすコードは「U+309B」(KATAKANA-HIR

    正規化 - odz buffer
  • OSとファイル名の関係に気をつけよう

    プラットフォーム間の問題 InDesign(インデザイン)はクロスプラットフォームを謳い文句にしているアプリケーションです。実際、操作性はWindows版とMacintosh版でほとんど同じ、出来上がるデータも同じでWindows版で作ったデータをMacintosh版で開いてもデータが変わってしまうことはありません。 さらにOpenTypeフォントだけを使っていれば、フォントの違いに悩まされることもありません。プラットフォームの違いが大きな壁となってきた従来のDTPを考えると大きな進歩と言えるでしょう。これも、OSに依存しないデータ管理を進めてきたAdobeの努力のたまものと言えるのかもしれません。 ただし、OSの違いによって起きる問題が完全になくなったわけではありません。その違いを把握していないと大きなトラブルになる可能性もあるのです。中でも注意しなければならないのがファイル名の問題で

  • 1