特に、特筆すべきポイントは、多言語対応において、LLMの方がまだ精度の高いケースがあると思うが、これは、大量の学習データを使っていることに起因している。 一方で、LCMは、SONARの埋め込み空間を使うことで、多言語対応が可能となっている。 LCMの特徴 概念図を理解できたところで、LCMにおける大きな3つの技術的な特徴を整理してみましょう。 SaT(Segment any Text)による分割 SONARによる多言語・マルチモーダルへの対応 拡散モデル(Diffusion)や量子化モデル(Quantized)などのアプローチによる改善 これらの3つの手法について、詳しく解説していきます。 1. SaT(Segment any Text)による分割 LCMの周辺技術として、「SaT」というテキストや音声など、さまざまな形態の言語情報を適切に分割・扱う手法があります。 SaTとは、Segme
