日々新しいオープンソースのLLMまたはllama2のような無償使用可能なLLMが出てくるので定期的にベンチマークをとって性能評価をまとめておきます。新しい日本語対応LLMが出るたびに更新していきます。 23/11/15Japanese-MT-BenchRWKV-V5-World-1.5Bを追加。他の3Bモデルと遜色ない性能 RWKV-V5-World-v2-3Bを追加 もちろん1.5Bよりは高性能だが倍の性能というわけではなさそう23/11/9Japanese-MT-BenchGPT-4-Turbo-1106のベンチマークを追加。コーディング能力が大幅に向上 23/11/7Japanese-MT-BenchGPT-3.5-Turbo-1106がリリースされたので追加 23/11/5Japanese-MT-BenchOpenCALM2-7B-Chatがfloat16で計測していたので、bfl
![無償LLM 日本語能力ベンチマークまとめ(23/11/15)|shi3z](https://cdn-ak-scissors.b.st-hatena.com/image/square/f8c87c6712a6552963f72730eec8232ceeb3ed48/height=288;version=1;width=512/https%3A%2F%2Fassets.st-note.com%2Fproduction%2Fuploads%2Fimages%2F120387049%2Frectangle_large_type_2_2524b76f95f69ff91759b3dcb76e6e26.jpeg%3Ffit%3Dbounds%26quality%3D85%26width%3D1280)