【小哈划重点:众多汽车制造商旨在开发一种自动标记系统,可以自动准确地标记大量素材。而特斯拉表示正在开发这样的工具,与其Dojo超级计算机配合使用,且已取得部分进展。】
据外媒报道,特斯拉(Tesla)人工智能和计算机视觉负责人Andrej Karpathy在国外社交媒体上发布了特斯拉为自动驾驶开发的汽车标记工具的短视频。该工具有望大大改进特斯拉全自动驾驶测试版。
(图片来源:electrek)
自动驾驶的标注数据
特斯拉很早就为其所有汽车配备了传感器。截至目前,其数据收集覆盖全球的100多万辆车,因此特斯拉在自动驾驶数据领域处于领先地位。
特斯拉能够使用广泛的数据集来改进神经网络,为Autopilot功能套件提供动力,进而实现全自动驾驶。然而,这些数据在被“标记”时更有价值,这意味着车队收集的图像信息被标记为信息,例如车辆、车道、街道标志等。
如果图像被正确标记,例如始终识别速度标志并将其正确标记,可以将一堆不同速度标志的不同图像提供给计算机视觉神经网络,以成功识别。
标记一直是特斯拉Autopilot团队的重点。去年,特斯拉人工智能和计算机视觉负责人Andrej Karpathy透露,特斯拉只有“几十名”工程师在研究神经网络,但却有一个“庞大”的团队在做标记工作。特斯拉正试图实现大量标记自动化,以便能够使用车队收集的大量数据。
去年,特斯拉首席执行官埃隆马斯克(Elon Musk)表示,驾驶员仅通过十字路口就可以有效地标记:从本质上讲,在驾驶和采取行动时,驾驶员可进行有效现实标记,并随驾驶时长提高标记质量。特斯拉的优势就在于其标记的数量远超其他汽车制造商。但特斯拉也有员工手动标记要输入其神经网络的数据。
自动标记
据报道,特斯拉雇佣了数千名贴标员,其中大部分在纽约超级工厂工作,但仍然错过了很多好数据。众多汽车制造商旨在开发一种自动标记系统,可以自动准确地标记大量素材。而特斯拉表示正在开发这样的工具,与其Dojo超级计算机配合使用,且已取得部分进展。
在推文中,Karpathy发布了来自特斯拉新汽车标记工具的图片,并表示:“这些是新项目的全精分割图像,但这些图片太原始,无法在车中运行,但可以输入到自动贴标机中。标记大型(10万+)、干净、多样、多机位+视频数据集的数据需要与训练模型的工程师协作。”
该多机位+视频数据、缓慢移动视点的时间连续性、与数据源和标记的密切协作以及无标记剪辑的无限大数据集,极大地扩展了神经网络方面的创造性建模机会。
Karpathy表示,这项技术部署仍处于早期阶段,期待有更多人的加入。
(文章原标题:《特斯拉发布短视频 展示自动标记工具》。文章视频未收录)