MacでPDFからコピペした時のNFD問題の対策。 MacでPDFからコピペした文字が、濁点/半濁点が離れる。 「お読みください」 「お読みくた゛さい」 Macのファインダーのコピーだと見た目的な違いが無いので判別が難しい。 原因 MacOSのファイルシステムであるHFS+が使用している、UTF-8の正規化方法が「NFD」というもので、2文字に分けて正規化されてしまうことが原因。 Mac で PDF からコピーした濁点/半濁点付きの文字列を Firefox に貼り付けた時におかしくなる問題の対処方法 対策とどこでクリアするか? NFD → NFCに変換をする。 nkf(Network Kanji Filter)で変換が可能。 UTF-8にもいろいろある どこで? コピーした時点で変換する。 タスクランナーに組み込んで変換する。 とりあえずの前者の仕組みを MacのAutomaterでシェル