今回掲載されたモデルは、日本語および英語データで事前学習を行なった70億パラメータのベースモデル「CyberAgentLM2-7B」にチャット形式でのチューニングを行った「CyberAgentLM2-7B-Chat」。本モデルは入出力の長さとして3万2000トークンに対応し、一度に約5万文字の日本語文章を処理できる。なお、同モデルは商用利用可能なApache License 2.0で提供されている。 今回、「CyberAgentLM」が「Amazon SageMaker JumpStart」で扱えるようになったことにより、日本語LLMを利用したい企業は簡単に「CyberAgentLM」を自社環境にデプロイできる。本モデルは、Amazon SageMaker JumpStartのメニューから選択可能。 同社は、日本語LLMの開発に積極的に取り組んでおり、2023年5月に「CyberAgent