大規模言語モデル(LLM)のほとんどは、主に英語と中国語のデータでトレーニングされています。そのため、それ以外の言語数千種類については文章生成の精度が落ちてしまうという問題があります。スタートアップ企業・Cohereの非営利研究組織であるCohere for AIがリリースしたLLM「Aya」は119カ国の研究者のべ3000人が参加したプロジェクトで開発され、既存のオープンソースLLMの2倍以上の言語をカバーしているとのことです。 Cohere For AI Launches Aya, an LLM Covering More Than 100 Languages https://txt.cohere.com/aya/ Aya | Cohere For AI https://cohere.com/research/aya?ref=txt.cohere.com Cohere for AIは「
