「judging」を検索 - はてなブックマーク

judgingの検索結果1 - 1 件 / 1件

LLMを用いたLLMの自動評価について〜可能性と注意点〜 - NTT Communications Engineers' Blog

こんにちは、イノベーションセンターの杉本（GitHub：kaisugi）です。普段はノーコードAI開発ツール Node-AI の開発に取り組む傍ら、兼務1で大規模言語モデル（LLM:Large Language Model）について調査を行なっています。特に、日本語を中心に学習された LLM への関心があり、awesome-japanese-llm という日本語 LLM をまとめた Web サイトのメンテナンスにも取り組んでいます。今回は、LLM に LLM の評価そのものを行わせるという新たなアプローチ（LLM-as-a-judge）についてご紹介します。 ChatGPT の登場以降、国内外で LLM の開発競争が進行しており、モデルの重みが公開されたオープンなモデルも続々と現れています。そのような中で、新しいモデルの構築だけでなく、どのモデルが優れているかを比較検討することが今後ます

はてなブックマーク

検索対象

並び順

ブックマーク数

セーフサーチ

期間指定

絞り込み

ブックマーク数

期間

セーフサーチ

judgingの検索結果1 - 1 件 / 1件

LLMを用いたLLMの自動評価について〜可能性と注意点〜 - NTT Communications Engineers' Blog

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

検索対象

並び順

ブックマーク数

セーフサーチ

期間指定

絞り込み

検索対象

ブックマーク数

期間

セーフサーチ

judgingの検索結果1 - 1 件 / 1件

LLMを用いたLLMの自動評価について 〜可能性と注意点〜 - NTT Communications Engineers' Blog

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

LLMを用いたLLMの自動評価について〜可能性と注意点〜 - NTT Communications Engineers' Blog