“LLM の評価は非常に困難であり、学術的なベンチマークは失敗する可能性があります。...モデルの Elo レーティングを計算するという新しいアプローチを採用しています。”

misshikimisshiki のブックマーク 2023/05/08 17:18

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

https://twitter.com/lmsysorg/status/1653843200975704069

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう