【小哈划重点:Waabi的竞争对手Wayve在2023年发布了一款类似的模型,该模型是根据其车辆收集的视频进行训练的。它获取激光雷达数据的点云,将汽车周围环境的3D地图可视化,并将其分解为块,类似于图像生成器将照片分解为像素的方式。】
这项名为Copilot4D的新系统使用激光雷达传感器的大量数据进行训练,这种传感器利用光来感知与物体之间的距离。
自动驾驶公司Waabi日前宣布,它正在使用一种生成式人工智能模型来帮助预测车辆的运动轨迹。
这项名为Copilot4D的新系统使用激光雷达传感器的大量数据进行训练,这种传感器利用光来感知与物体之间的距离。
如果你(以提示的方式)向模型输入一种情况,比如一个司机鲁莽地驶入高速,它会预测周围的车辆将如何运动,然后生成未来5-10秒的激光雷达示意图,以及展示潜在的追尾事故。
目前公布的是Copilot4D的初始版本,但Waabi的CEO拉奎尔·乌尔塔孙(Raquel Urtasun)表示,该公司在德克萨斯州的自动驾驶卡车测试车队中部署了一个更先进、更可解释的版本,帮助驾驶软件做出决策。
图 | 拉奎尔·乌尔塔孙(Raquel Urtasun)(来源:资料图)
虽然自动驾驶长期以来一直依赖机器学习来规划路线和检测物体,但一些公司和研究人员现在十分看好生成式人工智能,这种模型可以接收周围环境数据并生成预测,或将有助于将自动驾驶带到下一阶段。
Waabi的竞争对手Wayve在2023年发布了一款类似的模型,该模型是根据其车辆收集的视频进行训练的。
Waabi的模型与DALL-E和Sora等图像或视频生成器的工作方式相似。它获取激光雷达数据的点云,将汽车周围环境的3D地图可视化,并将其分解为块,类似于图像生成器将照片分解为像素的方式。
根据其训练数据,Copilot4D会预测激光雷达的数据点将如何移动。不断连续地这样做,就可以让它生成未来5-10秒的预测。
(来源:资料图)
少数几家自动驾驶公司将其策略描述为“人工智能优先”。对乌尔塔孙来说,这意味着设计一个从数据中学习的系统,而不是一个学习在特定情况下如何做出反应的系统。
这些公司相信,它们的方法可能需要更少的路测时间。2023年10月,在美国旧金山一辆Cruise无人驾驶汽车发生拖拽行人的事故后,道路测试成为了一个热门话题。
Waabi不同于其竞争对手,它为激光雷达而不是相机构建了一个生成式模型。
乌尔塔孙说:“如果你想实现4级自动驾驶,激光雷达是必须的。”她所说的4级自动驾驶是,汽车几乎不需要人类介入就能安全行驶。
她说摄像头能很好地显示汽车所看到的东西,但它们不太擅长测量距离或了解汽车周围的几何(状况)。
尽管Waabi的模型可以生成视频,显示汽车通过激光雷达传感器看到的情况,但这些视频不会在该公司用于构建和测试驾驶模型的驾驶模拟器中作为训练数据。这是为了确保Copilot4D产生的任何幻觉不会被模拟器吸收并传授。
美国斯坦福大学的博士生伯纳德·亚当·兰格(Bernard Adam Lange)建立并研究了类似的模型。他指出,底层技术并不新鲜,但这是他第一次看到生成式激光雷达模型脱离了实验室的限制,并扩大规模用于商业用途。
他说,像这样的模型通常有助于使任何自动驾驶汽车的“大脑”能够更快、更准确地推理。
他说:“规模才是真正具有变革性的东西,希望这些模型可以用于下游任务。”例如,检测物体和预测人或物下一步可能移动的位置。
Copilot4D只能预测短期的未来,而运动预测模型的性能会随着预测时长的增加而变弱。该模型只需要想象5到10秒会发生什么,同时Waabi的基准测试是基于3秒的预测。
美国斯坦福大学汽车研究中心联合主任克里斯·戈德斯(Chris Gerdes)表示,这一指标将是决定该模型在决策中有多大用途的关键。
他说:“如果5秒的预测是可靠的,但10秒的预测几乎不可用,那么它在许多真实路况下是不够用的。”
新模型呼应了一个生成式人工智能世界热议的问题:是否将模型开源。开源Copilot4D将使难以访问大型数据集的学术研究人员能够深入地了解其制作过程,独立评估其安全性,并有可能推动该领域的发展。
但Waabi的竞争对手也将因此获益。目前,该公司已经发表了一篇论文,详细介绍了模型的创建过程,但尚未发布代码。乌尔塔孙也不确定他们是否会发布。
“我们希望学术界对自动驾驶的未来也有发言权。”她说,并补充说开源模型更值得信任。“但我们在开发技术时也需要小心一点,以免向竞争对手透露一切。”
支持:Ren,排版:朵克斯
https://www.mittrchina.com/news/detail/13105