並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 26 件 / 26件

新着順 人気順

deepmindの検索結果1 - 26 件 / 26件

  • 見えてきた「生成AIの限界」がアーティストの不安を取り除く

    生成AIを使った実験を重ねるにつれて、クリエイティブ分野での限界が明確に理解されるようになってきた。AIとアーティストたちの力関係を変えようとする取り組みもいくつか始まっている。 by Melissa Heikkilä2024.06.30 190 8 この記事の3つのポイント AIとアーティストとの関係性はこの2年間で変化しつつある 独創的で面白いものを生み出すのは難しく、補強ツールとして使うのが最適 権利侵害を防ぐ技術やツールも開発が進み、不安を和らげている summarized by Claude 3 この記事は米国版ニュースレターを一部再編集したものです。 人工知能(AI)のジョークはありきたりだ。グーグル・ディープマインド(Google DeepMind)の研究チームがプロのコメディアン20人に依頼し、一般的なAI言語モデルを使ってジョークやコメディパフォーマンスの台本を書いてもら

      見えてきた「生成AIの限界」がアーティストの不安を取り除く
    • AIにとって微分可能性が必須条件でなくなりつつある意味

      AIにとって微分可能性が必須条件でなくなりつつある意味 2024.07.04 Updated by Ryo Shimizu on July 4, 2024, 12:26 pm JST かなり長い間、本欄でも「AI(人工知能)」と書くときに、注釈として「AI(人工ニューラルネットワーク)」と書く必要があった。 というのも、AIという言葉が指す意味は範囲がとても広く、解釈次第ではただの電卓や辞書、IMEまでもがAIと呼べてしまうからだ。 だから、「AI」という言葉を多用する人を見た時、それは「新しいインチキ(Atarashii Inchiki)」であると考えた方が良いというジョークを言ったものである。 ここ5年で、事態は一気に変化した。今やニューラルネットワークでないものを「AI」と呼ぶのは憚られる。まあそれでもニューラルネット以前の古いシステムをいまだに「AI」と呼ぶようなIT(インチキ)企

        AIにとって微分可能性が必須条件でなくなりつつある意味
      • MicrosoftのAI責任者が「オープンウェブ上のコンテンツはフリーウェア」と発言、AIトレーニングにウェブ上のコンテンツを利用しても問題ないという考えを強調

        Googleに買収されたAIスタートアップ・DeepMindの共同創設者であり、記事作成時点ではMicrosoftのAI開発部門であるMicrosoft AIのムスタファ・スレイマンCEOが、オープンウェブ上にコンテンツを公開した瞬間、誰でも自由にコピーして使用できる「フリーウェア」になるという考えを自身が持っていることを打ち明けました。テクノロジーメディアのThe Vergeは、「誤った考えを持っている」と批判しています。 Microsoft’s AI boss thinks it’s perfectly OK to steal content if it’s on the open web - The Verge https://www.theverge.com/2024/6/28/24188391/microsoft-ai-suleyman-social-contract-freew

          MicrosoftのAI責任者が「オープンウェブ上のコンテンツはフリーウェア」と発言、AIトレーニングにウェブ上のコンテンツを利用しても問題ないという考えを強調
        • Google DeepMindが「動画にピッタリな音楽を生成するAI」を発表

          画像や文章を生成するAIに続いて、動画生成AIも急速に進歩しつつありますが、これまでのAIが生成した動画は無音か人間が音を後付けしたものばかりでした。Google DeepMindが2024年6月17日に、映像の雰囲気や動きに合わせて音楽や音を生成する「video-to-audio(V2A)」を発表しました。 Generating audio for video - Google DeepMind https://deepmind.google/discover/blog/generating-audio-for-video/ Google DeepMindが今回発表したV2Aシステムは、動画生成AI「Veo」と組み合わせてドラマチックなBGMやリアルなSE、キャラクターのセリフなどを生成できる技術です。 例えば、以下のムービーは「Cinematic, thriller, horror f

            Google DeepMindが「動画にピッタリな音楽を生成するAI」を発表
          • 「現時点での汎用AIは猫程度のIQしかない」とGoogle DeepMindのデミス・ハサビスCEOが主張

            Google DeepMindの共同創業者兼CEOであるデミス・ハサビス氏が、イギリスの元首相であるトニー・ブレア氏との公開討論会で、「現代のAIは汎用(はんよう)システムとして、猫のIQにも達していない」と発言したことが報じられています。 Current AIs only have the IQ level of a cat, asserts Google DeepMind CEO | Tom's Hardware https://www.tomshardware.com/tech-industry/artificial-intelligence/current-ais-only-have-the-iq-level-of-a-cat-asserts-google-deepmind-ceo 公開討論会は、ブレア氏が主催するTony Blair Institute for Global Ch

              「現時点での汎用AIは猫程度のIQしかない」とGoogle DeepMindのデミス・ハサビスCEOが主張
            • Gemini について全部解説! 使い方やモデル、プランまで|Gemini - Google の AI

              こんにちは、Google の AI「Gemini(ジェミニ)」の公式 note 編集部です。 この記事ではGoogle の AI、Gemini に対するみなさんの疑問に答えていきたいと思っています! "Gemini" という名称で AI モデルやサービスが複数あるけど、違いは何? 有料版 / 無料版はどう選べばよい?アプリはあるの? などなど。 誰でもすぐに使える会話インターフェースの Gemini(gemini.google.com)の紹介を中心に、企業や開発者向けサービスの展開、すべての基盤となる Gemini モデルの話まで全体像を解説します。この記事を通じて、Google の AI「Gemini」をもっと知って、みなさんの役に立てていただけるようまとめました。 ※この記事は随時更新します(最終更新 2024 年 6 月 19 日)。 Google の AI、Gemini(ジェミニ)

                Gemini について全部解説! 使い方やモデル、プランまで|Gemini - Google の AI
              • OpenAI、5月に予告したChatGPTの高度な音声モード提供を延期

                米OpenAIは6月25日(現地時間)、5月の発表イベントで予告したChatGPTアプリのGPT-4oベースの新しい高度な音声モードのα版提供開始を、当初の6月下旬から延期すると発表した。「リリースの基準に達するまでにあと1カ月必要」としている。 「例えば特定のコンテンツを検出して応答を拒否するモデルの機能を改善している」という。 高度な音声モードは、感情や非言語的なジェスチャーの意味を理解して応答できるというもの。これにより、AIとのリアルタイムで自然な会話が可能になるとしている。 秋にはすべての有料版ユーザーが利用可能になる予定という。また、5月にデモを行った動画機能と画面共有機能の展開にも取り組んでいる(提供時期は未定)と説明した。 高度な音声モードをめぐっては、女性の音声が俳優のスカーレット・ヨハンソンの音声に似ていると話題になった。ヨハンソンはこの件に対応するため弁護士を雇ったと

                  OpenAI、5月に予告したChatGPTの高度な音声モード提供を延期
                • YouTubeがアーティストの音楽を模倣するAI音楽生成ツールを2024年にリリースするべくソニー&ワーナー&ユニバーサルと楽曲ライセンス取得の交渉中

                  YouTubeは、AIを用いた音楽生成ツールの開発を進めており、テキスト入力によって有名アーティストの音楽スタイルを模倣した短い楽曲クリップを生成できる「Dream Track」というAIツールの拡大を目指しています。YouTubeがソニー、ワーナー、ユニバーサルといった主要レコード会社と交渉を行い、より多くのアーティストの音楽をAIの学習データとして使用するライセンスを得ようとしていることが報じられています。 YouTube in talks with record labels over AI music deal https://www.ft.com/content/e2d9472d-32e0-43f5-8109-efb753fac330 YouTube in talks with major labels to license songs for AI tools: report

                    YouTubeがアーティストの音楽を模倣するAI音楽生成ツールを2024年にリリースするべくソニー&ワーナー&ユニバーサルと楽曲ライセンス取得の交渉中
                  • パープレキシティは「インターネット検索」を根本から覆すかもしれない | グーグルを脅かすAIスタートアップ

                    ChatGPTほどまだ浸透してはいないかもしれない。だが、ソフトバンクも提携を発表し、じわじわとその勢力を拡大するスタートアップ企業「Perplexity(パープレキシティ)」。彼らが生み出した「回答エンジン」は、インターネットの検索システム自体を変えてしまうのだろうか。 ある日突然、グーグルの検索エンジンに取って代わるアプリケーションが出現したら──。これまでなら突飛な仮説でしかなかっただろう。だが、生成AIの新時代において、こうした仮説はますます現実味を帯びてきている。 もちろん、この技術を実質的に発明したと言える巨大企業グーグルは、まだ始まったばかりのAI戦争において、反撃するための資本と頭脳のリソースを充分有している。しかし、OpenAI(オープンAI)による「ChatGPT」のような対話エージェントの普及は、グーグルの主要な糧である「グーグル検索」を揺るがしつつある。何千ものスタ

                      パープレキシティは「インターネット検索」を根本から覆すかもしれない | グーグルを脅かすAIスタートアップ
                    • なぜゲイリー・マーカスはAGI早期実現に否定的なのか|ララどり

                      Gary Marcus本題に入る前に、ゲイリー・マーカスについて簡単に振り返っておきたい。 Gary Fred Marcus(1970年生まれ54歳)は、認知科学と人工知能の第一人者である。23歳でマサチューセッツ工科大学から博士号を取得、現在はニューヨーク大学の心理学および神経科学の名誉教授であり、人間の言語発達や認知神経科学に関する研究で知られている。彼は作家としての顔も持ち、ベストセラー「Guitar Zero」(2012年)を含む5冊の著書を執筆している。「The Algebraic Mind」(2001年)では、現在のAIシステムが直面するハルシネーション問題を予見している。また、機械学習会社であるGeometric Intelligenceの創設者兼CEOとなり、同社は2016年にUberに買収された[1]。 以上がマーカス氏の略歴であるが、シンギュラリタリアンである私にとって

                        なぜゲイリー・マーカスはAGI早期実現に否定的なのか|ララどり
                      • アーティストがAIによるスタイルのコピーを防ぐための無料ツール「Glaze」がクラックされて突破されたことが明らかに

                        シカゴ大学の研究チームが提供している、人間が描いた絵画に対し目に見えない改変を加えてAIによる学習から保護するためのツール「Glaze」について、スイスのオンラインセキュリティ研究者らのチームが「Glazeの保護は簡単に回避可能」と指摘する論文を発表しました。 [2406.12027] Adversarial Perturbations Cannot Reliably Protect Artists From Generative AI https://arxiv.org/abs/2406.12027 Glazing over security | SPY Lab https://spylab.ai/blog/glaze/ Why I attack https://nicholas.carlini.com/writing/2024/why-i-attack.html Tool preven

                          アーティストがAIによるスタイルのコピーを防ぐための無料ツール「Glaze」がクラックされて突破されたことが明らかに
                        • シェイン グウ、 AI 研究者としての現在地|Gemini - Google の AI

                          *本 note は、Google がシェイン グウにインタビューした内容を編集して掲載しています。 こんにちは。Google の AI「Gemini(ジェミニ)」の公式 note 編集部です。今回は日本のみなさんに、Google の AI についてより理解を深めていただくために、Google DeepMind で Gemini モデルの日本語対応にも深く関わっている、Google 社員のシェイン グウのインタビューを 3 回にわたりお届けします。 シェインは、幼少期を日本で過ごし、カナダ、イギリス、ドイツ、アメリカで研究を重ねてきました。彼の研究テーマはディープラーニング、生成 AI、強化学習など多岐にわたり、手掛けた論文は業界に多大な影響を与えています。 Google が目指すのは、あらゆる場所で、あらゆる人にとって、AI が役に立てる世界です。そのためにも AI 開発の各段階で、潜在的

                            シェイン グウ、 AI 研究者としての現在地|Gemini - Google の AI
                          • OpenAIのサム・アルトマンCEOとハフポスト創設者が新会社「Thrive AI Health」を設立、超パーソナライズされたヘルスコーチAI提供へ

                            2016年にはGoogleのDeepMindをがん治療に使用する病院が現れるなど、医療は最も早くにAIを活用してきた分野のひとつです。2024年7月8日に、OpenAI関連のファンドであるOpenAI Startup Fundと、HuffPost(旧Huffington Post)の創設者であるアリアナ・ハフィントン氏が立ち上げたテクノロジー企業・Thrive Globalが提携し、専門家レベルのヘルスコーチングAIの提供を目指す「Thrive AI Health」を設立したことを発表しました。 OpenAI Startup Fund & Arianna Huffington's Thrive Global Create New Company, Thrive AI Health, To Launch Hyper-Personalized AI Health Coach https://w

                              OpenAIのサム・アルトマンCEOとハフポスト創設者が新会社「Thrive AI Health」を設立、超パーソナライズされたヘルスコーチAI提供へ
                            • OpenAI、企業向けWeb会議ツールのMultiを買収

                              このツールにはAI機能も搭載されており、会議の内容を要約したり、参加者が使ったファイルへのリンクを提供したりする。 フー氏がリポストした投資家のサラ・グオ氏のXポストによると、Multiの5人のエンジニア全員がOpenAI入りするようだ。 OpenAIは21日にはリアルタイム検索の米Rocksetを買収したと発表したばかりだ。 関連記事 OpenAI、リアルタイム検索のRocksetを買収 「検索インフラを強化する」 OpenAIはリアルタイム検索と分析ツールを手掛ける新興企業Rocksetを買収した。Rocksetの技術を統合して製品全体の検索インフラを強化する。 OpenAIの現・元従業員ら、AIシステム構築の無謀さと秘密主義を告発 OpenAIとGoogle DeepMindの現従業員、元従業員のグループは、OpenAIを含むAI企業に対し、AIに関する安全性対策の改善と、危険性を報

                                OpenAI、企業向けWeb会議ツールのMultiを買収
                              • 「AIに芸人のようなお笑いができるかどうか」をGoogle DeepMindが検証

                                OpenAIのChatGPTやGoogleのGeminiといったチャットボットは、ユーザーから投げかけられた質問や要求に対してある程度正確に答えてくれます。一方で、依然としてAIは人間レベルのジョークやお笑いは困難であるとの調査結果が発表されています。 A Robot Walks into a Bar: Can Language Models Serve as Creativity Support Tools for Comedy?An Evaluation of LLMs' Humour Alignment with Comedians - 2405.20956v2.pdf (PDFファイル)https://arxiv.org/pdf/2405.20956 Why AI being funny could herald the next big tech breakthrough | M

                                  「AIに芸人のようなお笑いができるかどうか」をGoogle DeepMindが検証
                                • AIは「笑い」を取れるか? プロがLLMにネタを書かせた結果

                                  大規模言語モデルはコメディのネタを作るツールとして使えるのだろうか? グーグル・ディープマインドの研究チームは、AIを使ったことのあるプロのコメディアン20人に調査を実施し、現時点での結論を得た。 by Rhiannon Williams2024.06.20 7 9 この記事の3つのポイント AIはコメディを書くのに使えるか、グーグルがコメディアンに依頼して調べた コメディの原案作りに役立つものの、独創性や面白さに欠ける ユーモアには意外性や矛盾が必要だが、LLMには難しい summarized by Claude 3 人工知能(AI)が得意とすることはたくさんある。データのパターンを見つけたり、すばらしい画像を生成したり、数千ワードの文章を数段落程度で要約したりすることだ。では、AIはコメディを書くのに使えるツールとなり得るだろうか? 新たな研究によると、可能ではあるが、その能力は非常に

                                    AIは「笑い」を取れるか? プロがLLMにネタを書かせた結果
                                  • OpenAI、リアルタイム検索のRocksetを買収 「検索インフラを強化する」

                                    米OpenAIは6月21日(現地時間)、データベースのリアルタイム検索と分析のツールを手掛ける新興企業Rocksetを買収したと発表した。Rocksetの技術を統合して製品全体の検索インフラを強化する。買収総額などの取引の詳細は公表されていない。 OpenAIのブラッド・ライトキャップCOO(最高執行責任者)は公式ブログで「Rocksetのインフラは、企業がデータを実用的なインテリジェンスに変換できるようにする。この技術をOpenAI製品に統合することで、これらのメリットを顧客に提供できることを嬉しく思う」と語った。 Rocksetは2016年創業の米カリフォルニア州サンマテオに拠点を置く非公開企業。元Facebook(現Meta)のエンジニアで現在RocksetのCEO、ヴェンカト・ヴェンカタラマニ氏らが創業した。企業がデータベースやパブリッククラウドからデータを自動的に取り込み、そのデ

                                      OpenAI、リアルタイム検索のRocksetを買収 「検索インフラを強化する」
                                    • Generating audio for video

                                      Research Generating audio for video Published 17 June 2024 Authors Generative Media team Video-to-audio research uses video pixels and text prompts to generate rich soundtracks Video generation models are advancing at an incredible pace, but many current systems can only generate silent output. One of the next major steps toward bringing generated movies to life is creating soundtracks for these s

                                        Generating audio for video
                                      • Google、オープンな生成AIモデル「Gemma 2」リリース 270億パラメータモデル追加

                                        米GoogleのGoogle DeepMindは6月27日(現地時間)、Google I/Oで予告した、軽量ながらも最先端の性能を持つオープン言語モデル「Gemma 2」を発表した。 2月に発表した「Gemma」は20億パラメータと70億パラメータの2サイズでの展開だったが、Gemma 2は90億パラメータと270億パラメータの2サイズ。 270億パラメータ版は、「そのサイズクラスで最高の性能を発揮し、2倍以上の規模のモデルに匹敵する性能を実現」するという。90億パラメータ版でも、米Metaの「Llama 3」の80億パラメータ版などを上回る性能を示すとしている。 Google Cloud TPU、NVIDIA A100、NVIDIA H100などの上で、完全精度で効率的に推論を実行できるように設計されており、高性能を維持しながらコストを大幅に削減できるという。高性能なゲーミングPCからク

                                          Google、オープンな生成AIモデル「Gemma 2」リリース 270億パラメータモデル追加
                                        • プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                          2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 AnthropicがClaudeファミリーの新モデル「Claude 3.5 Sonnet」をリリースしました。このモデルは、各種ベンチマークで同ファミリーの旧最上位モデルClaude 3 OpusやOpenAIのGPT-4を上回る性能を示しています。ユーザーの間でも様々な使用事例が共有され、その高性能ぶりが話題となっています。 一方、GoogleやNVIDIAから資金調達を受けているAIベンチャー「Runway」は、新しい動画生成AIモデル「Gen-3 Alpha」を発表しました。前モデルGen-2と比較して、忠実度、一貫性、モーションの面で大幅な改善が見られるとのことです。公開されているサンプル動画からも、その高精度が確認できます。 国内では、カ

                                            プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                          • わざと誤答させて出力品質を上げる? 最新のプロンプトエンジニアリングとは

                                            この連載について AIやデータ分析の分野では、毎日のように新しい技術やサービスが登場している。その中にはビジネスに役立つものも、根底をひっくり返すほどのものも存在する。本連載では、ITサービス企業・日本TCSの「AIラボ」で所長を務める三澤瑠花氏が、データ分析や生成AIの分野で注目されている最新論文や企業発表をビジネス視点から紹介する。 大規模言語モデル(LLM)の性能向上のため、プロンプトエンジニアリングのアプローチが続々提案されています。カーネギーメロン大学とDeepMindの研究チームは、あえてLLMにミスさせて最終的により良い回答を出力させる手法「Learning Principles」(LEAP)を提案しました。 上海科技大学の研究チームは、大規模で高性能なLLMが小規模なLLMをサポートする「RoT」(Reflection on search Trees)」という手法を提案しま

                                              わざと誤答させて出力品質を上げる? 最新のプロンプトエンジニアリングとは
                                            • OpenAI、「安全およびセキュリティ委員会」に元NSA長官のポール・ナカソネ氏

                                              米OpenAIは6月13日(現地時間)、元米国家安全保障局(NSA)長官兼米サイバー軍司令官のポール・ナカソネ氏(60)を取締役に迎えたと発表した。同氏は最近設立した「安全およびセキュリティ委員会」にも参加する予定。 OpenAIは発表文で「ナカソネ氏の洞察は、サイバーセキュリティの脅威を迅速に検知し対応することで、AIをどのように活用してサイバーセキュリティを強化できるかをより深く理解するというOpenAIの取り組みにも貢献するだろう」と説明した。 ナカソネ氏は発表文で「OpenAIの使命に対する献身は、私自身の価値観や公務員としての経験と一致している」と語った。 同氏はNSAと米サイバー軍で数十年の経験を積んでおり、当然これらの組織へのコネクションも持っている。 これで取締役会は、サム・アルトマンCEO、アダム・ダンジェロ氏、ラリー・サマーズ氏、ブレット・テイラー氏、ビル&メリンダ・ゲ

                                                OpenAI、「安全およびセキュリティ委員会」に元NSA長官のポール・ナカソネ氏
                                              • 中島聡氏が解説。GoogleのAI部門が開発中「タンパク質の折りたたみ問題」を解くソフトウェアが医学の進歩に与える大きすぎる影響 - まぐまぐニュース!

                                                GoogleのAI部門が開発を続けているソフトウェア「AlphaFold」。「タンパク質の折りたたみ問題」を解くためのAIプログラムとのことですが、そもそも「タンパク質の折りたたみ問題」とはいかなるもので、なぜこの問題を説くことが重要視されるのでしょうか。今回のメルマガ『週刊 Life is beautiful』では著者で世界的エンジニアとして知られる中島聡さんが、そんな疑問に対する答えを具体例を上げつつわかりやすく解説。さらに「AlphaFold」が医学の進歩に大きな影響を与える理由を紹介しています。 ※本記事のタイトルはMAG2NEWS編集部によるものです/原題:AIと医療(AlphaFold) プロフィール:中島聡(なかじま・さとし) ブロガー/起業家/ソフトウェア・エンジニア、工学修士(早稲田大学)/MBA(ワシントン大学)。NTT通信研究所/マイクロソフト日本法人/マイクロソフト

                                                  中島聡氏が解説。GoogleのAI部門が開発中「タンパク質の折りたたみ問題」を解くソフトウェアが医学の進歩に与える大きすぎる影響 - まぐまぐニュース!
                                                • Flaxを使用したRecurrentGemma2Bグリフィンモデルのファインチューニングチュートリアル(Kaggle、GoogleColabノート付) - Sun wood AI labs.2

                                                  セットアップ まずは必要なライブラリをインストールし、環境を整えていきます。 !pip list --format=freeze > requirements.kaggle.txt !pip list pip listコマンドでインストール済みのライブラリを一覧表示し、requirements.kaggle.txtファイルに出力しています。これは現在の環境を再現するために必要な情報です。 次に、RecurrentGemmaライブラリをインストールします。このライブラリはグリフィンモデルを扱うために必要です。 !pip install git+https://github.com/google-deepmind/recurrentgemma.git これでRecurrentGemmaがインストールできました。続いて、必要なライブラリをインポートしていきます。 import pathlib f

                                                  • Google DeepMindが自然言語で場所の案内などオフィス内のタスクをこなすデモムービーを公開

                                                    Gemini 1.5の最大100万トークンという長いコンテキストウィンドウを活用することで、オフィス内のタスクを自然言語で解決できるようになったとGoogle DeepMindが論文にまとめ、デモムービーを公開しました。 [2407.07775v1] Mobility VLA: Multimodal Instruction Navigation with Long-Context VLMs and Topological Graphs https://arxiv.org/abs/2407.07775v1 コンテキストウィンドウが大きいAIモデルは一度に多くの情報を扱うことが可能です。今回、DeepMindはオフィスや自宅を案内するムービーを撮影してAIに視聴させ、「どこに何があるのか」という環境についての情報を学習させました。 ユーザーが自然言語でAIに指示することで、AIがムービーの情報

                                                      Google DeepMindが自然言語で場所の案内などオフィス内のタスクをこなすデモムービーを公開
                                                    • 人間のような内省メカニズムをLLMに導入することの効果 Google DeepMindなどが検証 | AIDB

                                                      背景 LLMエージェントが複雑なタスクを遂行する能力が注目されています。しかし、予期せぬ状況に直面した際の適応力や一貫性には課題があることが指摘されています。 そこで、タスク実行後の振り返りなどが提案され、過去の成功や失敗から学習し、柔軟な戦略を立てることが試されてきました。しかし、振り返りは通常1つの(仮想的な)エラーを修正するだけであり、効率性に問題があります。 また、計画の頻繁な変更はLLMエージェントに混乱をもたらすことが懸念されています。人間にとっては単なる不便さかもしれませんが、LLMエージェントにとっては方向性を失ったり、停滞したり、さらには失敗の無限ループに陥る可能性があります。 そこで今回研究者らは、一貫性と適応性のバランスを最適化する方法論を提案しています。予期せぬ事態に備えながら計画を実行するための方法です。 タスクをサブタスクに分解し、行動と結果について内省を行うよ

                                                        人間のような内省メカニズムをLLMに導入することの効果 Google DeepMindなどが検証 | AIDB
                                                      1