この記事は、大規模言語モデル(LLM)の概要を改めて理解したい方向けに、1回で読み切れる分量でまとめた日本語記事になっています。なお、Referenceにも記載していますが、この手の内容だと、英語が理解できる方はAndrej Karpathy (Open AI co-founder)の講演”State of GPT | BRK216HFS“が動画でわかりやすい解説かと思いますので是非見てみてください。また、より技術的なLLMの取り扱いは、Weights & BiasesのLLM White Paper “LLMをゼロから トレーニングするためのベストプラクティス”が非常にわかりやすく質の高い資料になっているので、是非ご覧ください。 Transformerの登場と基盤モデルとして進化従来の自然言語処理 (RNN / LSTMなど)自然言語処理の分野では、SVMやCRFなどの統計的機械学習に基
![Overview of 大規模言語モデル(LLM)](https://cdn-ak-scissors.b.st-hatena.com/image/square/27f8b00082b92cdb37932085ae5835f6ba566389/height=288;version=1;width=512/https%3A%2F%2Fmiro.medium.com%2Fv2%2Fresize%3Afit%3A1024%2F0%2Aur3NMwJuQrFqbpw_.png)