[B! Be My Eyes] diet55のブックマーク

diet55 id:diet55

Be My Eyesに関するdiet55のブックマーク (3)

GPT-4V(ision) System Cardをざっくり訳した - Qiita
はじめに OpenAIが3月に発表していたものの実装していなかった、画像および音声を取り扱うことのできるマルチモーダルモデル「GPT4-V」のdeployが発表されました。本当に全部この会社がやればいいんじゃないか？ ChatGPTのPlus/Enterpriseユーザーに2週間かけて提供するそうです。最近ChatGPTのほうの処理能力が落ちつつあってGPT-4のAPIばっかり使ってるんですが、ChatGPT Plusは解約できそうにないですね。 GPT4-Vを中心としたV&LのLLMはDocumentUnderstandingの文脈での活用が期待されており、先日Googleを中心としたグループもLMDX: Language Model-based Document Information Extraction and Localizationという論文を発表していました。Geminiなん
diet55 2023/10/06
「Be My AIは（中略）Be My EyesプラットフォームにGPT-4Vを統合しました。」「これまでのマルチモーダルLLMでは光学文字認識(OCR)の能力がかなりイマイチなことが知られていますが、何らかの方法で改善したっぽいです。」

Be My Eyes

AI

disabilities

visually

OCR

GPT-4V
リンク
「ChatGPT」が見て、聞いて、話せるように～音声・画像対応のマルチモーダルAI／今後2週間のうちに「Plus」および「Enterprise」で提供
diet55 2023/09/26
「視覚障碍者にとってはより重要な役割を果たすことになるだろう。同社は視覚障害者向けの無料モバイルアプリ「Be My Eyes」と協力し」「たとえば、目の不自由な人がTVに写っている人物をを知りたいとき」

ChatGPT

disabilities

visually

Be My Eyes
リンク
他者の眼になる魔法のようなインターネット体験。”Be My Eyes “ - フジイユウジ::ドットネット
目の見えない人が、床に物を落として困っている。見えにくい視力の方が、説明書の小さい文字が読めずに困っている。そんなときも目の見える人―――例えばぼくが―――代わりに見て説明すればいい。遠く離れた場所にいる知らない人でも大丈夫。今日は、そんな超絶すごい体験を作り出してるアプリの話です。 “Be My Eyes”というインターネット体験。仕事中、机の上に置いてあるスマホが震える。“Be My Eyes”というアプリの呼び出し通知。ちょっと通話する余裕くらいはあるなと思ったら通話に出ればいいし、時間がないときなら他に時間のある人が出てくれるから自分が出なくもいい。通話に出たら、スマホのカメラを通して目の見えない人から頼まれたものを見て説明する。「説明書を読んでもらえませんか？電気の消し方を知りたくて。」「ボタンを長押しすれば電気が消えるって書いてありますよー」「床に落としたものを
diet55 2022/12/16
私も含めて、周りでインストールしている人は多い。「他の人の役に立ったよ！」と報告のツイートをしているフォロワーさんがいると、思わず fav してしまう。

visually

disabilities

camera

Be My Eyes
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx