タグ

reasoning&actingとzennに関するnabinnoのブックマーク (1)

  • 意思決定を行うためのprompt技術 ReAct

    Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao 概要 大規模言語モデルの使いこなしに関する研究. 既存研究のでchain-of-thoughtでは,言語モデルが生成する文章の根拠を自身に生成させることで質問応答タスクの精度が向上した.しかしながら,この「根拠」は言語モデルの内部知識を活用したものなので,間違う可能性が大いにあった.また思考の過程もブラックボックスのまま. そこでReActという新しいprompting手法を考案した.ReActは理由づけと行動計画を言語モデル自身に複数回行わせる.これによって思考の過程が明確になるだけでなく,外部知識の活用がスムーズになった. ReActをより詳しく ReActのpromptの書き方は、以下の論文から引用した図を見ると

    意思決定を行うためのprompt技術 ReAct
  • 1