
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【RAG】画像に「補助線」を入れるだけで精度向上する手法
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【RAG】画像に「補助線」を入れるだけで精度向上する手法
本記事では、LLMの「画像読み取り性能」を高める手法について、ざっくり紹介します。 株式会社ナレッジ... 本記事では、LLMの「画像読み取り性能」を高める手法について、ざっくり紹介します。 株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何 この記事は、画像に「横線」を引くだけでLLMの画像読み取りの性能を向上させる手法を提案した論文[1]について、日本語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は、こちらの記事もご参考下さい。 ※ちなみにこの手法は直接的にはRAGではありません。しかし、2025年は「マルチモーダルRAG」が流行する年です。例えば、社内データの「ごちゃごちゃしたポンチ絵」などを正確に読み取れると、マルチモーダルRAGの精度は向上します。 本題 ざっくりサマリー 画像に3本の横線を追加し、「この線に沿って順番に見て