shogo_okamotoのブックマーク / 2023年12月18日

GPT-4Vのモデルを利用してOCRできるか試してみた - Taste of Tech Topics

こんにちは、安部です。気温の上下に翻弄されて最近風邪をひいてしまいましたが、皆さま元気にお過ごしでしょうか。今回は、GPT-4Vのモデルを利用して、OCRができるか試していきます。 GPT-4Vによって、「ChatGPTに目ができた」などと騒がれましたが、文字認識はどれくらいできるのでしょうか？得意分野ではなさそうですが、GPTも進化が目覚ましいので分かりませんね。検証では、日本語(漢字/ひらがな/カタカナ)・英語の2言語で精度など比較していきます。また、手書き・活字での違いも見ていきましょう。一番簡単に試せるChatGPT（Web版）でOCRをさせようとするとエラーになることが多かったので、ここではAPIを使っていくこととします。 APIを呼び出すプログラム以下のコードを使い、gpt-4-vision-previewというモデルを呼び出しています。画像は個人のgithu

はてなブックマーク

タグ

2023年12月18日のブックマーク (2件)

Excelに毎度同じWebサイト上のテキストデータをまとめる苦行は自動化で解脱！【残業を減らす！Officeテクニック】

GPT-4Vのモデルを利用してOCRできるか試してみた - Taste of Tech Topics

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス