2024年、英国ロンドンの街をこれまでにないタイプの斬新な自動運転車が走行した(図1)。なんと、このクルマを運転するのは「大規模言語モデル」なのだ。 様々なモジュールを組み合わせて作られていた既存の自動運転AIと異なり、言葉を紡ぐために生まれた大規模言語モデルが、カメラや各種センサから周囲の状況を判断解釈し、適切なアクセルとステアリング量を生成・出力している。いわゆるマルチモーダル型の大規模言語モデルだ。 現在、ロボットの領域では、大規模言語モデルにロボットの行動指令値を直接生成させる取り組みが米Google(グーグル)などを中心に進んでいるが、そうした流れが、今度は自動運転の領域に波及した形だ。