【小哈划重点:他们的方法是利用反射将有光泽的物体变为“摄像头”,让用户可以看到世界,就好像通过陶瓷咖啡杯或金属纸镇等日常物品的“镜头”观看世界一样。】
当一辆汽车在狭窄的城市街道上行驶时,路边停放汽车的光泽漆面或后视镜的反射可以帮助驾驶员看到原本隐藏在视线里的东西,如看到一个孩子在停放汽车后面的人行道上玩耍。
新型计算机视觉技术,利用反射将有光泽的物体变成“摄像头”(图片来源:MIT)
据外媒报道,基于上述情形,美国麻省理工学院(MIT)与莱斯大学(Rice University)的研究人员打造了一种利用反射成像的计算机视觉技术。他们的方法是利用反射将有光泽的物体变为“摄像头”,让用户可以看到世界,就好像通过陶瓷咖啡杯或金属纸镇等日常物品的“镜头”观看世界一样。
利用从不同角度拍摄的物体图像,该技术将物体表面转变成可以捕捉反射的虚拟传感器。该人工智能(AI)系统以某种方式映射此类反射,使其能够估计场景的深度,并捕捉只能从物体角度看到的新视图。人们可采用此种方式看到周围的角落或者障碍物之外的视野。
此种方法对于自动驾驶汽车而言尤其有用。例如,其可让自动驾驶汽车利用经过的物体(如路灯或建筑物)的反射来观察停放的卡车周围的情况。
罪案电视节目中的主人公经常把监控录像“放大,增强(细节)”来捕捉反射,也许是从犯罪嫌疑人的太阳镜中捕捉反射画面,从而帮助破案。
研究人员表示:“在现实生活中,利用这些反射画面不像按一个增强按钮那么简单。从反射中得到有用的信息很难,因为反射会提供一个扭曲的视图。”
此种扭曲取决于物体的形状以及物体所反射的世界,而研究人员对这两者都没有完整的信息。此外,有光泽的物体在反射时会混杂自己的颜色和纹理。另外,反射是对三维世界的二维投影,因此很难判断反射场景的深度。
研究人员找到了克服此类挑战的方法,该技术称为ORCa(物体作为辐射场摄像头),工作分为三个步骤。首先,可以从很多有利位置拍摄物体照片,捕捉有光泽的物体上的多重反射。
然后,对于来自真正摄像头的每张照片,ORCa技术利用机器学习将物体表面变为虚拟传感器,捕捉物体表面每个虚拟像素的光线和反射。最后,系统利用物体表面的虚拟像素从物体的角度对三维环境进行建模。
从多个角度对物体成像让ORCa能够捕获多个视点的反射,让该系统除了利用此类反射估算场景中有光泽的物体与其他物体之间的深度,还能估判该物体的形状。ORCa将场景建模为5D辐射场,捕获从场景中每个点发出并击中场景中每个点的光线的强度和方向。
该5D辐射场中包含的额外信息也有助于ORCa准确地估计深度,而且由于该场景展现为5D辐射场而非2D图像,用户可以看到被角落或障碍物阻挡的隐藏物体特征。
事实上,一旦ORCa捕捉到该5D辐射场,用户就能够在场景的任意地方放置一个虚拟摄像头,并合成该摄像头将看到的东西。用户还可以将虚拟物体插入到环境中,或者改变陶瓷、金属等物体的外观。
研究人员通过将其与其他模拟反射的方法(与ORCa执行的任务略有不同)进行比较,以评估该技术。他们的方法在反射中分离出物体的真实颜色方面表现良好,并且在提取更精确的物体几何形状和纹理方面优于基准。
研究人员将系统的深度估计与场景中物体之间实际距离的模拟真实数据进行了比较,发现 ORCa的预测十分可靠。
基于该概念验证,研究人员希望将该技术应用于无人机成像。ORCa可以利用无人机飞过物体的微弱反射,重建地面上的场景。研究人员还想提升ORCa技术,让其可以利用阴影等线索,来重建隐藏的信息,或者结合两个物体的反射内容,对场景中的新部分进行成像。