エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
無償LLM 日本語能力ベンチマークまとめ(23/11/15)|shi3z
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
無償LLM 日本語能力ベンチマークまとめ(23/11/15)|shi3z
日々新しいオープンソースのLLMまたはllama2のような無償使用可能なLLMが出てくるので定期的にベンチマ... 日々新しいオープンソースのLLMまたはllama2のような無償使用可能なLLMが出てくるので定期的にベンチマークをとって性能評価をまとめておきます。新しい日本語対応LLMが出るたびに更新していきます。 23/11/15Japanese-MT-BenchRWKV-V5-World-1.5Bを追加。他の3Bモデルと遜色ない性能 RWKV-V5-World-v2-3Bを追加 もちろん1.5Bよりは高性能だが倍の性能というわけではなさそう23/11/9Japanese-MT-BenchGPT-4-Turbo-1106のベンチマークを追加。コーディング能力が大幅に向上 23/11/7Japanese-MT-BenchGPT-3.5-Turbo-1106がリリースされたので追加 23/11/5Japanese-MT-BenchOpenCALM2-7B-Chatがfloat16で計測していたので、bfl