強力なLLM（例: GPT-4）にLLMの評価そのものをやらせるLLM-as-a-judge の解説と実践 "実際に運用する上では、単に出力の優劣を決めるだけではなく、さまざまな観点から出力を評価できるようなプロンプトを設計する必要がある"

t-wada のブックマーク 2023/09/25 09:31

<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4742679524762042671/comment/t-wada" data-user-id="t-wada" data-entry-url="https://b.hatena.ne.jp/entry/s/engineers.ntt.com/entry/2023/09/25/091245" data-original-href="https://engineers.ntt.com/entry/2023/09/25/091245" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fengineers.ntt.com%2Fentry%2F2023%2F09%2F25%2F091245" data-user-icon="/users/t-wada/profile.png">LLMを用いたLLMの自動評価について 〜可能性と注意点〜 - NTT Communications Engineers' Blog</a><br><p style="clear: left">強力なLLM（例: GPT-4）にLLMの評価そのものをやらせるLLM-as-a-judge の解説と実践 &quot;実際に運用する上では、単に出力の優劣を決めるだけではなく、さまざまな観点から出力を評価できるようなプロンプトを設計する必要がある&quot;</p><a class="datetime" href="https://b.hatena.ne.jp/t-wada/20230925#bookmark-4742679524762042671"><span class="datetime-body">2023/09/25 09:31</span></a></blockquote><script src="https://b.st-hatena.com/js/comment-widget.js" charset="utf-8" async></script>

このブックマークにはスターがありません。
最初のスターをつけてみよう！