タグ

ブックマーク / olachinkei.medium.com (1)

  • Overview of 大規模言語モデル(LLM)

    この記事は、大規模言語モデル(LLM)の概要を改めて理解したい方向けに、1回で読み切れる分量でまとめた日語記事になっています。なお、Referenceにも記載していますが、この手の内容だと、英語が理解できる方はAndrej Karpathy (Open AI co-founder)の講演”State of GPT | BRK216HFS“が動画でわかりやすい解説かと思いますので是非見てみてください。また、より技術的なLLMの取り扱いは、Weights & BiasesのLLM White Paper “LLMをゼロから トレーニングするためのベストプラクティス”が非常にわかりやすく質の高い資料になっているので、是非ご覧ください。 Transformerの登場と基盤モデルとして進化従来の自然言語処理 (RNN / LSTMなど)自然言語処理の分野では、SVMやCRFなどの統計的機械学習に基

    Overview of 大規模言語モデル(LLM)
  • 1