
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【Python】PDFからコピーした改行コードだらけのテキストを上手いこと整形する - Qiita
はじめに もともとは前々回、前回の記事 【Python】英文PDF(に限らないけど)をDeepLやGoogle翻訳で自... はじめに もともとは前々回、前回の記事 【Python】英文PDF(に限らないけど)をDeepLやGoogle翻訳で自動で翻訳させてテキストファイルにしてしまおう。 続【Python】英文PDF(に限らないけど)をDeepLやGoogle翻訳で自動で翻訳させてテキストファイル、いやHTMLにしてしまおう。 で使用するために書いたものですが、役に立ちそうなので別途紹介する次第です。 PDFからコピーしたテキストの問題点 PDFについての詳しい知識は持ち合わせていないのですが、 PDF内ではテキストが細かいパーツに分割されて書き込んであるようで、コピーしたテキストにもPDFでの表示の通りの位置に改行コードが含まれます。 例えば、PDFで $$ABC.\\DFE.\\GHI.$$ のような表示の場合、コピーしたテキストは、 $$ABC.{\r\n}DEF.{\r\n}GHI.$$ といった具合で
2022/02/06 リンク