タグ

LLMに関するavictorsのブックマーク (4)

  • GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?

    大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論能力が小学生未満という研究結果があったりと、脆弱(ぜいじゃく)さについてもしばしば指摘されます。AIの能力の限界を示す「ストロベリー問題」という脆弱性について、機械学習エンジニアのチンメイ・ジョグ氏が解説しています。 The 'strawberrry' problem: How to overcome AI's limitations | VentureBeat https://venturebeat.com/ai/the-strawberrry-problem-how-to-overcome-ais-limitations/ ChatGPTやStable DiffusionなどのジェネレーティブAIは、高度な文章やコードを書けたり、イラストやリアルな画

    GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?
    avictors
    avictors 2024/10/20
    LLMの仕組み、トークンのパターンマッチング予測アルゴリズムと生物や知性の発生機序が本質的に同じかもしれないのと、ChatGPTの部分的模倣性がすごすぎて爆発的進化期が近いかもと期待してしまうが、まだ1種類の分節。
  • 「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表

    AppleAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。 この論文は、LLM(大規模言語モデル)が、当に人間のように論理的に考えて問題を解けるのか、という疑問を検証している。結論としては、LLMは今のところ、表面的なパターンを真似て答えを出しているだけで、真の推論能力は持っていないと主張している。 研究者らは、これらの問題点を検証するために、「GSM-Symbolic」という新しいテスト方法を開発した。これは、LLMの数学的推論能力を評価するためのベンチマークデータセット「GSM8K」を改良し、問題の表現や数字を柔軟に変えられるようにした

    「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表
    avictors
    avictors 2024/10/13
    まだ形態素間など色んな分割単位での1層内だけの地図なのかな。各単語概念間の連結をサブ概念の集合やメタ概念の一部にも繋ぎデータ量数倍に膨らせ、人で幾つか公理概念を決めれば三段論法的推論も可能になるのでは
  • 【2024年1月最新】共通テストを色んな生成AIに解かせてみた(ChatGPT vs Bard vs Claude2)|株式会社LifePrompt

    2023年の流行語大賞にも選ばれた「生成AI」。 ChatGPTだけでなく、Google BardやClaude2など似たようなAIチャットボットも登場し、性能も日に日に上がっている感覚がありますね。 しかし、結局どれが一番賢いんだろう?と思いつつひとまずChatGPTを使っている方も多いはず。 そこで、今どのチャットAIが一番頭良いのか白黒つけてしまおう!ということで、ちょうど週末に行われた大学入試共通テスト2024を使って学力テストを行いました! 参加する学生は、 ①GPT-4くん ②Google Bardちゃん ③Claude2さん の三名です 果たして誰が学力王の座に輝くのか・・・? 選手入場①GPT-4くん一人目は、皆さんご存じChatGPTです。Open AI予備校に月額$20の課金して学力武装しています。 特徴としては、プロンプトの研究が進んでおり、画像やPDFファイルの読み

    【2024年1月最新】共通テストを色んな生成AIに解かせてみた(ChatGPT vs Bard vs Claude2)|株式会社LifePrompt
    avictors
    avictors 2024/01/17
    作業が複数重なると壊れるのは重ね方の情報が少ないからかな。数学は、人間なら多分当て込み帰納と演繹の間の往復繰り返して解くけど、生成AIはおおまかには帰納のみなので解けない。
  • OpenAIが4度目のブレイクスルーとなる数学ができるAI「Q*(キュースター)」で汎用人工知能開発の飛躍を目指す、アルトマンCEO解任騒動の一因か

    OpenAIが新たなAI開発プロジェクト「Q*(キュースター)」を進めていることを認めたと報じられています。このQ*は数学的推論能力の改善を目指したもので、汎用人工知能(AGI)の研究に画期的な進歩をもたらすかもしれず、2023年11月に起こったサム・アルトマンCEO解任騒動の一因にもなった可能性が指摘されています。 OpenAI researchers warned board of AI breakthrough ahead of CEO ouster, sources say | Reuters https://www.reuters.com/technology/sam-altmans-ouster-openai-was-precipitated-by-letter-board-about-ai-breakthrough-2023-11-22/ OpenAI ‘was workin

    OpenAIが4度目のブレイクスルーとなる数学ができるAI「Q*(キュースター)」で汎用人工知能開発の飛躍を目指す、アルトマンCEO解任騒動の一因か
    avictors
    avictors 2023/11/24
    今までは、記号の繋がり易さの判断により「概念」という枠を作れるようになってた。類似性判断からの帰納に似てる。算数は、これに三段論法による推論演繹を得ればできる。しかし一体どの時点で停止できるか。
  • 1