タグ

PaLMに関するshirotorabyakkoのブックマーク (3)

  • PaLM 2 のご紹介

    過去 10 年間の AI における最大の進化を振り返ると、Google はその多くの場面で先頭に立ってきました。私たちの基盤モデルにおける画期的な研究は、この業界と何十億人もの人々が毎日使用している AI を活用した製品の基礎になっています。私たちがこれらの技術を責任を持って進歩させ続けることで、医療から人間の創作活動に至るまで、広範囲にわたる分野で大きな変革をもたらすことができる可能性があります。 AI の開発における過去 10 年間に、私たちはニューラルネットワークを大規模化することで非常に多くのことが可能になることを学びました。実際、より大きなサイズのモデルが驚くべき能力を示すのを見てきました。しかし同時に、私たちの研究を通じて、それは「大きければ良い」という単純なものではなく、創造的な研究が優れたモデルを構築するための鍵であることも学びました。モデルのアーキテクチャと学習方法に関す

    PaLM 2 のご紹介
  • 最近話題になった大規模言語モデルまとめ|npaka

    最近話題になった大規模言語モデルをまとめました。 1. クラウドサービス1-1. GPT-4「GPT-4」は、「OpenAI」によって開発された大規模言語モデルです。 マルチモーダルで、テキストと画像のプロンプトを受け入れることができるようになりました。最大トークン数が4Kから32kに増えました。推論能力も飛躍的に向上しています。 現在、「ChatGPT Plus」(有料版)で制限付きで利用できる他、ウェイトリストの登録者を対象に「OpenAI API」での利用も開始しています。

    最近話題になった大規模言語モデルまとめ|npaka
  • ロボットの頭脳を動かすマルチモーダルな視覚言語「PaLM-E」とは何か?(Google Tales) | テクノエッジ TechnoEdge

    IT海外速報を書いたり、翻訳を請け負ったりしています。初めてのスマートフォンはHTC Desire。その後はNexus 5からずっとGoogleさんオリジナルモデルを使っています。 OpenAIChatGPTAPI提供を開始して以来、怒涛のように関連サービスが発表され続けています。Googleさんはまだその波には乗らない(いろいろ事情もあって乗れないのかも)ようですが、内部ではAIに注力しています。 3月6日には、以前から社キャンパスで研修中のロボットたちの頭脳になるかもしれない「PaLM-E」なるものの論文を公開しました。大まかに言うと「マルチモーダルな視覚言語」だそうです。 ▲Google社キャンパスで研修中のロボット AI分野では、「モーダル」は処理するデータの種類のことを指します。GPT-3.5が処理できるのはテキストだけなのでシングルモーダル。テキストのプロンプトで画

    ロボットの頭脳を動かすマルチモーダルな視覚言語「PaLM-E」とは何か?(Google Tales) | テクノエッジ TechnoEdge
  • 1