LLM のベンチマークまとめ｜npaka

テクノロジーカテゴリーの変更を依頼記事元:

note.com/npaka

16 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

stealthinu LLMの性能を評価する方法。いくつか手法があるがやはりGPT4に評価させるのがベースになりそう。

2023/08/26 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

LLM のベンチマークまとめ｜npaka

「LLM」のベンチマークをまとめました。 1. マルチモーダルのベンチマークマルチモーダルのベンチマー... 「LLM」のベンチマークをまとめました。 1. マルチモーダルのベンチマークマルチモーダルのベンチマーク。 1-1. Heron VLM リーダーボード (wandb) 【日本語】「Japanese-Heron-Bench」「LLaVA-Bench-In-the-Wild (Japanese)」の総合評価。・Japanese-Heron-Bench (Turing) 21枚の画像に対して計102問の質問。日本に関する知識を要求。・LLaVA-Bench-In-the-Wild (Japanese) (Turing) 24枚の画像に対して計60問の質問。「LLaVA-Bench-In-the-Wild」の日本訳。

ブックマークしたユーザー

shodai2024/08/06
xiangze2024/06/26
door-s-dev2023/09/08
stealthinu2023/08/26
Econgi2023/08/23
Wacky2023/08/22
warud2023/08/22
kybernetes2023/08/22
cutc-mt2023/08/22
deejayroka2023/08/22
giass2023/08/21

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx