ロボットアームで特定のオブジェクトを正確に操作するだけでなく、自然言語でオブジェクトの抽象的な概念を理解する機械学習フレームワーク「CLIPort」を、半導体メーカーでありAI技術の開発も行うNVIDIAとワシントン大学の研究チームが発表しました。 CLIPort https://cliport.github.io/ 近年の研究から、エンドツーエンドのネットワークによって、AIが空間的な推論を必要とする器用な操作スキルを習得できることが示されています。しかし、従来の方法では一度習得したスキルを一般化して新たなスキルに適用したり、同じ概念を別のスキルに転用できないことが多いと研究チームは指摘。また、大規模なデータトレーニングによって、視覚と言語の一般化可能な意味学習が大幅な進歩を遂げましたが、これは正確な操作に必要な空間的理解を欠いているとのこと。 研究チームは視覚ベースの操作を実現するため