エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
LLM as a Judgeを活用!Knowledge Base EvaluationでのRAG評価 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
LLM as a Judgeを活用!Knowledge Base EvaluationでのRAG評価 - Qiita
5 実験条件 Bedrock Knowledge Basesで構築したナレッジベースをKnowledge Base Evaluationで評価 ナレ... 5 実験条件 Bedrock Knowledge Basesで構築したナレッジベースをKnowledge Base Evaluationで評価 ナレッジベースは2種類用意し、同じテストデータセットでの評価結果をコンソール上で比較 Hierarchical chunking Semantical chunking ※チャンキング戦略以外の条件は一致 Retrieval and response generationで全8項目を評価 RAGのGenerationにはClaude Sonnet 3を使用 LLM as a Judgeでの評価モデルにはClaude Haiku 3を利用 6 評価実施手順 Bedrockの左メニューバーの「Inference and Assessment」から「Evaluations」を選択 Evaluations画面の「Knowledge Bases」タブを選択

