昨今LLM(Large Language Model)が大きな注目を集める一方で、パラメータ数がどのように決まるかについて抑えておくと理解に役立ちます。そこで当記事ではLLMの主要モジュールであるTransformerに用いられるパラメータの概算法について取りまとめを行いました。 Transformerの論文や筆者作成の『直感的に理解するTransformer』の内容などを元に取りまとめを行いました。 ・用語/公式解説 https://www.hello-statisticians.com/explain-terms ・Transformer論文 ・直感的に理解するTransformer(運営者作成) パラメータ数の概算 パラメータ数の単位 LLM(Large Language Model)関連の論文ではパラメータ数はMillionを表すMやBillionを表すBで略記されるので注意が必要