サクサク読めて、アプリ限定の機能も多数!
強力なLLM(例: GPT-4)にLLMの評価そのものをやらせるLLM-as-a-judge の解説と実践 "実際に運用する上では、単に出力の優劣を決めるだけではなく、さまざまな観点から出力を評価できるようなプロンプトを設計する必要がある"
t-wada のブックマーク 2023/09/25 09:31
LLMを用いたLLMの自動評価について 〜可能性と注意点〜 - NTT Communications Engineers' Blog強力なLLM(例: GPT-4)にLLMの評価そのものをやらせるLLM-as-a-judge の解説と実践 "実際に運用する上では、単に出力の優劣を決めるだけではなく、さまざまな観点から出力を評価できるようなプロンプトを設計する必要がある"2023/09/25 09:31
強力なLLM(例: GPT-4)にLLMの評価そのものをやらせるLLM-as-a-judge の解説と実践 "実際に運用する上では、単に出力の優劣を決めるだけではなく、さまざまな観点から出力を評価できるようなプロンプトを設計する必要がある"
このブックマークにはスターがありません。 最初のスターをつけてみよう!
engineers.ntt.com2023/09/25
こんにちは、イノベーションセンターの杉本(GitHub:kaisugi)です。普段はノーコードAI開発ツール Node-AI の開発に取り組む傍ら、兼務1で大規模言語モデル(LLM:Large Language Model)について調査を行なって...
122 人がブックマーク・6 件のコメント
\ コメントが サクサク読める アプリです /
強力なLLM(例: GPT-4)にLLMの評価そのものをやらせるLLM-as-a-judge の解説と実践 "実際に運用する上では、単に出力の優劣を決めるだけではなく、さまざまな観点から出力を評価できるようなプロンプトを設計する必要がある"
t-wada のブックマーク 2023/09/25 09:31
このブックマークにはスターがありません。
最初のスターをつけてみよう!
LLMを用いたLLMの自動評価について 〜可能性と注意点〜 - NTT Communications Engineers' Blog
engineers.ntt.com2023/09/25
こんにちは、イノベーションセンターの杉本(GitHub:kaisugi)です。普段はノーコードAI開発ツール Node-AI の開発に取り組む傍ら、兼務1で大規模言語モデル(LLM:Large Language Model)について調査を行なって...
122 人がブックマーク・6 件のコメント
\ コメントが サクサク読める アプリです /