エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
PDFの文字をコピーしたときに濁点や半濁点がバラバラ文字(合成文字)になったら | バシャログ。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
PDFの文字をコピーしたときに濁点や半濁点がバラバラ文字(合成文字)になったら | バシャログ。
寒くなったり暑くなったりで毎日の服装に困っているyanagimachiです。 この前PDFから文字だけを抜き出す... 寒くなったり暑くなったりで毎日の服装に困っているyanagimachiです。 この前PDFから文字だけを抜き出すツールをMacで使ったところ、濁点や半濁点がバラバラ文字(合成文字)になってしまいました。 こういうときはどうすればいいのでしょうか? テキストだと分かりづらいので、画像にしてみました。 ぱっと見気づかなかったので指摘に驚いてしまいましたが、データを用意したのは私。 でも作業するのは別の人! 迷惑かけられないし(すでに日常的にかけてるし?)どうすれば・・・と思ったら、バラバラ文字(NFD)からいつもの文字(NFC)変換するツールがありました。 ちなみに原因は「Unicodeによる文字の正規化の種類の違い」らしいです。 ツールの使い方 NFD→NFC変換ツールをブラウザで開いて、【変換したいテキスト】にバラバラ文字を入力。 「↓変換」ボタンをクリックすると、【変換後のテキスト】に変