
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
PDFや画像から文字を読み取れるウェブアプリを作りました【PDF.js + tesseract.js】
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
PDFや画像から文字を読み取れるウェブアプリを作りました【PDF.js + tesseract.js】
これは何 PDFや画像から一部を切り出してOCRするウェブアプリを作りました。 構成 TypeScript v4.0.5 Re... これは何 PDFや画像から一部を切り出してOCRするウェブアプリを作りました。 構成 TypeScript v4.0.5 React.js v17.0.1 (本記事では特に解説しない) tesseract.js v2.1.4 pdfjs-dist v2.5.207 ソースコード 作った経緯 11月の頭頃から、GoToトラベルのアレを利用して安くなってたので飛びついた自動車の免許合宿に行ってたんですが、そこで一緒の部屋で仲良くなった人に「文字がコピペ出来ないPDFがあるんだけど見てほしい」という相談を受けました。 とりあえず見てみると、該当するページは90度回転して記録されており、色々といじくってみたところ「見た目は文字だけどデータ的にはただの図形」という状態になっていることがわかりました。 免許合宿中は正直言ってかなり暇だったので、暇つぶしを兼ねてこれを解決するアプリを作ってみようというこ