タグ

2023年9月26日のブックマーク (2件)

  • ChatGPT can now see, hear, and speak

    We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT what you’re talking about. We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT w

    ChatGPT can now see, hear, and speak
    rt24
    rt24 2023/09/26
    イラストだとデッサン崩れとか指摘してくれるのかなー
  • ChatGPT、“目”と“耳”の実装を発表 写真の内容を認識、発話機能でおしゃべりも可能に

    OpenAIは9月25日(現地時間)、同社のチャットAIChatGPT」に、画像認識、音声認識、発話機能が搭載されたと発表した。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。画像機能はPCやスマートフォンなど全てのプラットフォームからアクセスでき、音声機能はiOS/Androidで利用可能。 画像認識機能は、写真やスクリーンショット、テキストと画像の両方を含むドキュメントなどの読み取りが可能。OpenAIでは「グリルが起動しない原因を解決したり、冷蔵庫の中身を調べて事の計画を立てたり、仕事関連のデータの複雑なグラフを分析したりできる」としている。 複数枚の画像読み取りにも対応。認識してほしい部分を丸で囲ってChatGPTに読み込ませることができる他、ChatGPTと話している内容を画像で表示させることも可能という。こうした画像認識は、マルチモーダル

    ChatGPT、“目”と“耳”の実装を発表 写真の内容を認識、発話機能でおしゃべりも可能に
    rt24
    rt24 2023/09/26
    さながらシヴィライゼーションの科学勝利のように、「シンギュラリティ」というゴールに向けて急速かつ着実にパーツが完成していくような感じがある