WEELメディア事業部LLMリサーチャーの中田です。 3月11日、日本語特化型の大規模言語モデル「Swallow on mistral(Swallow-MS 7B, Swallow-MX 8x7B)」を、東京工業大学の岡崎研究室と横田研究室、産業技術総合研究所の研究チームが公開しました。 このモデルは、「Mistral 7B」と「Mixtral 8x7B」の日本語能力が強化されたものなんです! Xでの投稿のいいね数は、国内だけですでに300を超えており、注目されていることが分かります。 大規模言語モデルSwallow-MS 7BとSwallow-MX 8x7Bを公開しました。東京工業大学の岡崎研究室と横田研究室、産業技術総合研究所の研究チームでMistral 7BとMixtral 8x7Bの日本語能力を引き上げました。Swallow-MS 7Bはオープンな7BのLLMの中で日本語最高性能を