エージェントに過去の行動を振り返りさせることでブラッシュアップする手法だそうです。 プログラム合成や多段階の推論まで、幅広く成果が見られるとのこと。 最もシンプルなものから複雑なもので3パターンあります。 Simple Reflection Reflexion(↑とつづりが違う) Language Agents Tree Search Simple Reflection 一番シンプルなリフレクションエージェント。 ジェネレーターとリフレクターという2つのLLMコールがある。 ジェネレーターは回答を生成する リフレクターは教師として、その回答に建設的な批評をする 一定回数それを繰り返し、最後の回答だけ出力する。 最もシンプルな例の図。ジェネレーター脳が生成した回答をリフレクター脳が批判・メリット・提案を並べて評価している プロンプト 新しい情報を使って前回の解答を修正する。 - 前回の講評を
![自分で答えて自分でツッコミ!リフレクションエージェントとは](https://cdn-ak-scissors.b.st-hatena.com/image/square/4201a3dfb74d0e96abeb3727da8ec622670fcc1a/height=288;version=1;width=512/https%3A%2F%2Fres.cloudinary.com%2Fzenn%2Fimage%2Fupload%2Fs--Ef2o1sI_--%2Fc_fit%252Cg_north_west%252Cl_text%3Anotosansjp-medium.otf_55%3A%2525E8%252587%2525AA%2525E5%252588%252586%2525E3%252581%2525A7%2525E7%2525AD%252594%2525E3%252581%252588%2525E3%252581%2525A6%2525E8%252587%2525AA%2525E5%252588%252586%2525E3%252581%2525A7%2525E3%252583%252584%2525E3%252583%252583%2525E3%252582%2525B3%2525E3%252583%25259F%2525EF%2525BC%252581%2525E3%252583%2525AA%2525E3%252583%252595%2525E3%252583%2525AC%2525E3%252582%2525AF%2525E3%252582%2525B7%2525E3%252583%2525A7%2525E3%252583%2525B3%2525E3%252582%2525A8%2525E3%252583%2525BC%2525E3%252582%2525B8%2525E3%252582%2525A7%2525E3%252583%2525B3%2525E3%252583%252588%2525E3%252581%2525A8%2525E3%252581%2525AF%252Cw_1010%252Cx_90%252Cy_100%2Fg_south_west%252Cl_text%3Anotosansjp-medium.otf_37%3Aykn%252Cx_203%252Cy_121%2Fg_south_west%252Ch_90%252Cl_fetch%3AaHR0cHM6Ly9zdG9yYWdlLmdvb2dsZWFwaXMuY29tL3plbm4tdXNlci11cGxvYWQvYXZhdGFyLzc0NTEwYjM4MjIuanBlZw%3D%3D%252Cr_max%252Cw_90%252Cx_87%252Cy_95%2Fv1627283836%2Fdefault%2Fog-base-w1200-v2.png)