qiita.com[B!]新着記事・評価 - はてなブックマーク

『qiita.com』

RAGの品質評価フレームワークの選択肢 - Qiita
3 users
qiita.com/ymgc3

RAGの品質評価最近、LLMコミュニティは自動評価の利用を探求しており、多くの研究者や企業がLLMを使用して自身のLLMアプリケーションの出力を評価しています。 DatabricksがGPT-3.5とGPT-4を評価として使用して、自社のチャットボットアプリケーションを評価した実践は、LLMを自動評価ツールとして使用することが効果的であることを示唆しています。この方法がRAGベースのアプリケーションを効率的かつコスト効果的に評価することもできるでしょう。評価のためのフレームワーク RAG評価フレームワークの分野では、RAGAS、ARESが比較的新しいものです。これらの評価の主な焦点は、回答の信頼性、回答の関連性、およびコンテキストの関連性という3つの主要な指標にあります。さらに、オープンソースライブラリであるTruLensも同様の評価モードを提供しています。これらのフレームワーク
- テクノロジー
- 2024/05/04 10:37

「AWSのアレはAzureでいうとコレだよね」チートシート - Qiita
3 users
qiita.com/ymgc3

はじめにいろんなクラウド環境を使う人と交流するときに、サービス名の対応がすぐにわかると良いなと思った。「AWS でいう Lambda が、 GCP の Cloud Functions だよ。」みたいな説明をする。自分にとっての母語と外国語の対応がわかると、理解が断然早くなるはず。
- テクノロジー
- 2023/10/23 10:06

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx