言語モデルの長文コンテキスト処理:「Lost in the Middle」現象の実態と最新研究 はじめに 近年、GPT-4、Claude、Llama 3などの大規模言語モデル(LLM)は、最大コンテキスト長を数万トークンから数十万トークンへと急速に拡大してきました。長いコンテキスト処理能力の向上は、より複雑なタスクや豊富な情報を扱うための重要な進展です。しかし、「コンテキスト長の増加が必ずしもモデル性能の向上につながらない」という「Lost in the Middle」現象が注目を集める一方で、この現象に疑問を投げかける研究も増えています。本記事では、長いコンテキストが言語モデルの性能に及ぼす影響について、支持する研究と反論する研究の両面から最新の知見をバランスよく解説します。 「Lost in the Middle」現象とは 現象の概要 2023年、Liu らによって提唱された「Lost
