【小哈划重点:这些图像属于名为ObjectNet的数据集一部分,该数据集来自MIT的科学家,以测试AI视觉的局限性。研究科学家鲍里斯·卡茨(Boris Katz)告诉《MIT新闻》:“我们创建了这个数据集来告诉人们对象识别问题仍然是一个难题。我们需要更好,更智能的算法。”】
机器视觉一直是人工智能热潮中最大的成功案例之一,它可以实现从自动医疗扫描到自动驾驶汽车的所有功能。但是,尽管所有视觉算法的准确性都有了很大的提高,但这些系统仍然可能被人类可以轻松识别的图像所迷惑。
看看下面的2张图片,都没有特别令人困惑的地方吧?您会看到锤子,烤箱手套,尽管中间图片很难辨认,但可以很快地看出来是从上方看去的椅子。同时,最先进的机器视觉算法可能只会识别这些对象中的一两个。对于应该驾驶我们的汽车的系统来说,这是一个巨大的降级。
这些图像属于名为ObjectNet的数据集一部分,该数据集来自MIT的科学家,以测试AI视觉的局限性。研究科学家鲍里斯·卡茨(Boris Katz)告诉《 MIT新闻》:“我们创建了这个数据集来告诉人们对象识别问题仍然是一个难题。我们需要更好,更智能的算法。”
更好的数据可以构建更好的算法,而ObjectNet将在这方面提供帮助。它包含5万张从奇怪角度或在令人惊讶的环境中观看的物体图像(比如沙发上倒着的茶壶或浴室里靠在椅背上的餐椅)。ObjectNet可以用来测试和评估不同算法的能力。
这类图像很难被计算机处理,因为它们没有出现在训练数据中,并且因为这些系统对现实世界中的对象工作方式了解有限。 AI系统无法轻松地从它们以前看过的项目中推断出来,以想象它们在不同角度,在不同灯光下的形象。改善AI视觉系统的性能也不是没有可能。这只需要时间,精力和训练。