エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
日本語対応 OCR モデルの比較 - TECHSCORE BLOG
記事へのコメント0件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
日本語対応 OCR モデルの比較 - TECHSCORE BLOG
はじめに 私は書籍を全文検索するために、OCRでテキスト化を行なっています。 コストの面から、個人利用... はじめに 私は書籍を全文検索するために、OCRでテキスト化を行なっています。 コストの面から、個人利用無料のYomiTokuというローカルOCRを使っていますが、どの程度の精度なのか知るために、簡単に他のOCRモデルと比較してみました。 TL;DR(3行まとめ) 強いノイズあり → Google Cloud Vision一択(唯一実用レベル) 通常の文書 → Azure or YomiToku(最高精度・高速・低コスト) OpenAI系 → 今回の日本語OCRでは全般的に不適 比較対象モデル OCR専用でないものも含めて、以下のモデルを比較対象としました。 Google Cloud Vision Document AI Azure Computer Vision OCR YomiToku CPU利用 GPU利用 Python の Tesseract OpenAIのチャットAIモデル GPT

