エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント27件
- 注目コメント
- 新着コメント
yarumato
“「見 高 長 音 玉」など簡単な漢字がコピペすると似た別字(部首文字)になるしPDF検索できない。PDF内部はUnicode無関係でコピペ時にPDF埋め込みcmapでUnicode化。TeXの解決法。AdobeJapan1フォントでも解決可能<-無料で配布”
Dai44
思ってたのと違う(全ての文字が検索できないしコピペすると記号になる系。官公庁のドキュメントでたまに見かける。こっちが原因なのかな… https://www.antenna.co.jp/pdf/reference/searchable-pdf.html )
junjuns7
仕組みがわからないから、Adobeのサポートの中の人のインド人に現象だけで説明してわかってもらうのムリ過ぎていつも泣いてた。こんどから少しわかる。 普通に文字コードで持ってくれればいいのに。
t-wada
PDF内部では文字コードではなくグリフIDで管理しているが、グリフIDとUnicode符号は1対1対応しておらず、グリフ変換前の文字コードも捨ててしまうので、グリフから文字コードに戻すときに別のコードに当たってしまう
jiro68
そもそもPDFが最初に出来た当時は、PDFの中のテキストをコピペして使うという用途は想定していなかったと思う。あくまでもフォーマットされた「文書」をそのまま他のコンピュータでも再現するための技術。仕方ない。
blueboy
PDF の規格に問題があるんだから、Adobe が規格を変えて対応するべき問題だろ。 文字化けする規格なんて、欠陥規格なんだから、滅びろ。 / そもそも、テキスト化できないように、わざとやっているだろ。これが理由。
Dai44
思ってたのと違う(全ての文字が検索できないしコピペすると記号になる系。官公庁のドキュメントでたまに見かける。こっちが原因なのかな… https://www.antenna.co.jp/pdf/reference/searchable-pdf.html )
junjuns7
仕組みがわからないから、Adobeのサポートの中の人のインド人に現象だけで説明してわかってもらうのムリ過ぎていつも泣いてた。こんどから少しわかる。 普通に文字コードで持ってくれればいいのに。
yarumato
“「見 高 長 音 玉」など簡単な漢字がコピペすると似た別字(部首文字)になるしPDF検索できない。PDF内部はUnicode無関係でコピペ時にPDF埋め込みcmapでUnicode化。TeXの解決法。AdobeJapan1フォントでも解決可能<-無料で配布”
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
いまの話題をアプリでチェック!
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
2021/02/28 リンク