tsuchikazuのブックマーク / 2024年6月12日

tsuchikazu id:tsuchikazu

2024年6月12日のブックマーク (3件)

RAG for Agentプロセスという考え方｜深津貴之 (fladdict)
マルチステップエージェントの安定化についてAIでマルチステップエージェントを作る際、安定した挙動にすることが難しいという話をよく耳にします。多くの人はRAG（Retrieval-Augmented Generation）に知識を入れていますが、プロセス情報を先に入れたRAGを作る方が良いのではないかというコンセプトについて考えてみました。プロセス情報を先にRAGに入れる例えば、XXしたいときの手順を以下のように構成します：調査: どこを調べるべきか考慮: どう考えるべきかツールの使用: どのツールを使うべきか保存: 結果をどう保存するかこのように、エージェントのプロセス情報をRAGとして用意しておくことで、エージェントの処理が安定し、結果的にエージェントの回答も安定します。このプロセス処理の安定性がRAGで保証されると、AIエージェントが「印刷する」みたいな、自分でできないタ
tsuchikazu 2024/06/12
リンク
レコメンドアルゴリズム入門：基礎から応用まで実装に必要な知識を解説 - Qiita
1: 購入 0: 閲覧(したが購入してない) -: 未観測ユーザーベース型ユーザー同士の類似度を計算「あなたと購入履歴の似たユーザーはこんな商品を買っています」行を各ユーザーのベクトルとみなして、似たユーザーを見つける（上位N人）似たユーザーが購入しているアイテムを推薦する（N人の平均値などで購入しそうな順に提示）アイテムベース型アイテム同士の類似度を計算「この商品を買ったユーザーはこんな商品も買ってます」列を各アイテムのベクトルとみなして、類似度の高いアイテムを推薦する（上位M件）類似度計算には、コサイン類似度やJaccard類似度が使われる。類似度を計算する際に、未観測「-」は適当な値（0, 0.5など）で埋めるか、無視をする。ログデータを使うため、情報の少ない新規アイテム/新規ユーザーに弱いコールドスタート問題がある。コンテンツベースフィルタリングアイテム
tsuchikazu 2024/06/12
リンク
LLMによるLLMの評価（LLM as a judge）の精度改善のためのプロンプトエンジニアリング
LLM-as-a-Judgeとは LLMをアプリケーションに組み込んでいると、LLMの出力を評価する必要が出てきます。 LLMの「出力は確率的である（毎回異なる）」ためです。また、LLMの出力はハルシネーションを含む可能性がありますし、間違いではないにしてもサービス提供者の意図とは違った出力をエンドユーザーに提示してしまうかもしれません。 LLMの出力を評価して、出力が適切でないことを判定できれば、ユーザーには表示しない、出力を再度行わせる（出力をLLMに修正させるのもよいでしょう）というようなことができるようになります。ただし、LLMのすべての出力を人が評価していたのでは、手が回りません。そこで、注目されているのが、LLM-as-a-Judgeと呼ばれるLLMにLLMの出力を評価させる手法（以後、単に評価と呼ぶ）です。評価にLLMを使えば、出力をすぐに評価し、評価結果をアプリケー
tsuchikazu 2024/06/12
リンク
- 2024年6月13日
- 2024年6月12日
- 2024年6月11日