Azureの最新AI技術、GPT-4 Turbo with Visionは、写真やドキュメントの画像からテキストを読み取り、内容を理解できる高度な画像分析機能を備えたGPT-4モデルです。 さらに、Azure AI VisionのOCR(光学文字認識)拡張機能と組み合わせることで、このモデルの能力は飛躍的に向上します。 文字が密集している画像、形状が変形した画像、数字が多用される財務文書など、複雑なビジュアル情報を含むケースでも、精度の高いテキスト解析を行うことが可能となります。 learn.microsoft.com OpenAIから提供されるChatGPT Plusも画像分析機能を持っています。 今回は消防庁が公開している検査用資料を用いて、AzureのGPT-4 Turbo with VisionとChatGPT Plusの性能を比較しました。この比較を通じて、OCR拡張機能の組み合
![GPT-4 Turbo with VisionとOCR拡張機能:画像分析性能の飛躍的向上 - JBS Tech Blog](https://cdn-ak-scissors.b.st-hatena.com/image/square/722b121f7b9aa1f7c59db6b580919612f9c26c18/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fj%2Fjbs_mkabuki%2F20240221%2F20240221121713.png)