タグ

UIに関するhamamuratakuoのブックマーク (3)

  • 新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)

    OpenAIは5月13日(現地時間)、「Spring Update」と題したをオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」お披露目のほか、mac OS用デスクトップアプリや各種無料化施策なども発表した。 テキスト理解力は過去最高 GPT-4oは、これまでのフラッグシップモデル「GPT-4 Turbo」と同等の性能を持ちながら、より高速化され、テキスト、音声、画像の理解力も大幅に向上したという触れ込みの最新LLMだ。 ちなみにGPT-4oの「o」は、「すべての」「全てを含む」という意味を持つラテン語の接頭辞「omni(オムニ)」から来ている。 以前から得意な英語とプログラムコードに関してはGPT-4 Turboと同等の性能を発揮し、英語以外の言語のテキストでは大幅な改善がみられるという。 ベンチマーク(OpenAIが提供するsimple-eva

    新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)
    hamamuratakuo
    hamamuratakuo 2024/05/16
    真にすごいのは、音声、画像を含めたマルチモーダルな理解力だ。
  • 増えるタッチパネルに困ってます 視覚障害者には何も伝わらず 「世の中は便利になるけど」増す生きづらさ:東京新聞 TOKYO Web

    荒川区町屋の職場近くのスーパーでは、支払い方法をタッチパネルで選ばなければいけない。全盲の長島さんは店員に操作してもらっている。カードの暗証番号は知られたくないので、スマートフォンのバーコード決済を使う。混雑時は店員に申し訳ないと、買い物には行かないようにしている。 銀行のATMは、一部の操作がタッチパネルでないとできない。行員に暗証番号を口頭で伝えて入力してもらう必要がある。視覚障害のある仲間も、マイナ保険証の利用時にタッチパネルで暗証番号の入力を求められ困っている。「信用はしているが、個人情報が守られているだろうかという不安は消えない」

    増えるタッチパネルに困ってます 視覚障害者には何も伝わらず 「世の中は便利になるけど」増す生きづらさ:東京新聞 TOKYO Web
    hamamuratakuo
    hamamuratakuo 2024/04/14
    サービス業の接客に、音声会話ができるマルチモーダルAIの投入が待たれる?
  • 「耳ぴく」で操作できるメガネ機器 “ダブルぴくぴく”や“3秒ロングぴく”などで入力 神戸高専が開発

    手などを使わずに耳を動かす能力「耳ぴく」ができる人が一定数の割合で存在する。この研究では、この動作を眼鏡型ウェアラブルデバイスの入力として用いるハンズフリーな手法を提案する。 眼鏡を装着した状態で耳ぴくを行うと、眼鏡が後ろに引っ張られることで、眼鏡のレンズ側が顔に近づく。この原理を利用し、眼鏡の上部に静電容量式タッチセンサーか圧力センサーを搭載し、耳ぴくを検出する2つのプロトタイプを製作した。 タッチセンサー型では、装着した電極が物体と接触することを認識し、これにより耳ぴくの存在を感知する。この接触を感知する過程では、人の体に触れた際に加わる静電容量が電極に結び付き、これが原因で電流の急激な増加を示す過渡応答の時間が延長する現象を利用する。 圧力センサー型では、耳ぴくを行っていない状態でも額に軽く触れるように圧力センサーを設置し、耳ぴくをする際に増加する圧力を計測することで耳ぴくを検出する

    「耳ぴく」で操作できるメガネ機器 “ダブルぴくぴく”や“3秒ロングぴく”などで入力 神戸高専が開発
  • 1