エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
あらゆるLLMを「使い心地」基準でバトルさせる便利なプラットフォーム『Chatbot Arena:チャットボットアリーナ』 | AIDB
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
あらゆるLLMを「使い心地」基準でバトルさせる便利なプラットフォーム『Chatbot Arena:チャットボットアリーナ』 | AIDB
ホーム LLM, 有料記事, 論文 あらゆるLLMを「使い心地」基準でバトルさせる便利なプラットフォーム『Cha... ホーム LLM, 有料記事, 論文 あらゆるLLMを「使い心地」基準でバトルさせる便利なプラットフォーム『Chatbot Arena:チャットボットアリーナ』 UCバークレーなどの研究者らは、「(結局のところ)人間の好みに合うLLMはどれなのか?」と疑問を持ち、匿名LLMをバトルさせ投票で優劣を決める『Chatbot Arena:チャットボットアリーナ』を開発しました。 Claude2.1やMistral(MoE)など新進気鋭のLLMも参戦しています。 なお、12/21時点ではMistral(MoE)がオープンソースLLMのトップに躍り出ており、さらにクローズドLLMの新モデルであるGemini Proも登場し高順位にいます。 参照論文情報 タイトル:Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena 著者:Lianmin Zhen