日本電信電話(NTT)は,撮影された画像から照明条件によらない「真の色」である物体固有の反射率(アルベド)を推定する固有画像分解タスクにおいて,LiDAR反射強度を用いた手法を確立し,従来の教師無し学習手法の中で最高精度を達成した(ニュースリリース)。 実世界において,画像・映像を撮影してデジタルデータとして取り込む際,撮影時の照明条件によってAI解析の精度やユーザ体験の品質に大きく影響するという課題がある。 例えば,物体認識や自己位置推定では,撮影時の照明条件が推定精度に影響を与えるため,様々な照明条件下で撮影した画像データを集めて検証する必要がある。また,メタバース空間の構築では,複数のデータを統合する際,さまざまな日照条件で計測したデータがツギハギになり,メタバース空間に撮影時の影が残ってしまう問題があった。 同社は今回,カメラ等で撮影された画像から影などの照明条件に依存した成分を取