オックスフォード大学の研究チームとMetaのAI研究部門が、画像から3D情報を取り出す新しいAIモデル「VGGT」を発表しました。従来の技術では、3D情報を得るために複雑な計算処理が必要でしたが、VGGTは一度の処理で画像から直接、カメラの位置や向き、物体の奥行き、3D空間での点の位置などを素早く計算できます。 VGGT: Visual Geometry Grounded Transformer https://vgg-t.github.io/ [2503.11651] VGGT: Visual Geometry Grounded Transformer https://arxiv.org/abs/2503.11651 VGGTは「Visual Geometry Grounded Transformer」の略で、従来の3Dコンピュータビジョン技術と異なり、単一のフィードフォワードニューラル
