サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
体力トレーニング
tatsu-lab.github.io
About AlpacaEval AlpacaEval an LLM-based automatic evaluation that is fast, cheap, and reliable. It is based on the AlpacaFarm evaluation set, which tests the ability of models to follow general user instructions. These responses are then compared to reference responses (Davinci003 for AlpacaEval, GPT-4 Preview for AlpacaEval 2.0) by the provided GPT-4 based auto-annotators, which results in the w
このページを最初にブックマークしてみませんか?
『tatsu-lab.github.io』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く