AMDがオープンソースの言語モデル「Instella」を発表しました。InstellaはAMD Instinct MI300X GPUを使用してトレーニングされた30億パラメーターのモデルで、Llama-3.2-3B、Gemma-2-2B、Qwen-2.5-3Bなどの最先端のオープンウェイトモデルと比較して競争力のあるパフォーマンスを発揮すると述べられています。 Introducing Instella: New State-of-the-art Fully Open 3B Language Models — ROCm Blogs https://rocm.blogs.amd.com/artificial-intelligence/introducing-instella-3B/README.html Instellaは30億パラメーターを持つテキスト専用のトランスフォーマーベースの言語モ

