エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【imp-v1-3b】わずか3Bの超小型MLLMでCAPTCHAを破れるのか検証してみた | WEEL
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【imp-v1-3b】わずか3Bの超小型MLLMでCAPTCHAを破れるのか検証してみた | WEEL
WEELメディア事業部LLMリサーチャーの中田です。 画像とテキストを入力するだけで簡単に、AIに画像認識... WEELメディア事業部LLMリサーチャーの中田です。 画像とテキストを入力するだけで簡単に、AIに画像認識をさせることができるマルチモーダルモデル「imp-v1-3b」が公開されました。 このマルチモーダルモデルAIは小規模でありながら、高性能なんです、、、! Xでのいいね数は、すでに650を超えており、かなり注目されています。 この記事ではimp-v1-3bの使い方や、有効性の検証まで行います。本記事を熟読することで、imp-v1-3bの凄さを実感し、GPT-4Vよりもimp-v1-3bを使いたくなるかもしれません。 ぜひ、最後までご覧ください。 imp-v1-3bの概要 imp-v1-3bは、テキストと画像の情報を一緒に扱える、小型のマルチモーダルモデルです。 このモデルを用いることで、以下のように、「入力画像に対してチャット形式での質問」ができるのです。 参考:https://hug