Preferred Networks(以下、PFN)および Preferred Elements(以下、PFE)では、大規模言語モデル(以下、LLM)の開発を進めており、PLaMo 100B を 2024 年 10 月に公開しました。現在は次世代モデルである PLaMo 2 の開発(※)を行っています。今回の記事では、PLaMo 2 に採用したトークナイザの改善について紹介します。 PLaMo 2 のトークナイザは、前のバージョンである PLaMo 100 B と比較して、日本語のトークン効率が 45 %、英語のトークン効率が 25 % 向上しました。ここでいうトークン効率とは、入出力に使われる文字列において 1 トークンで平均で何文字表現できるかを表します。これが改善する(増える)ことは、日本語の文章生成が 45 % 高速化し、同じ計算資源で学習できるデータ量が 45 % 増えることを意
