※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。 AppleのMachine Learning Researchが、arXivにおいて「OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework」を論文発表しています。 大規模な言語モデルの再現性と透明性は、オープンな研究を推進し、結果の信頼性を確保し、データやモデルの偏りや潜在的なリスクの調査を可能にするために極めて重要です。この目的のために、私たちは最先端のオープン言語モデルであるOpenELMをリリースしたと説明しています。 OpenELMは、レイヤーごとのスケーリング戦略を用いて、変換モデルの各レイヤーに効率的にパラメータを