【小哈划重点:张军平说,图像识别率达到99.9%是在设定环境下完成的,而实际应用都是开放环境,涉及到光照、尺度、角度等的处理,还有目标分割、图像匹配、目标识别,“整个过程是一个系统工程,并非简单的图片识别”。】
各大电商平台推出的拍照购物功能,让消费者轻而易举搜索线下动心商品实现购买。然而,该功能诞生以来始终称不上火爆,近日有部分网友发现,电商拍照购物功能频频“翻车”,识别误差让人诧异。各平台标榜的超90%的图片识别率怎么不灵了?
以京东平台推出的“拍照购”产品为例,记者从京东相关技术人员方面了解到,“拍照购”技术仍处于不断优化阶段,也会因环境光线、商品外形特征、拍照的角度等因素而影响到搜索结果。“目前已制定详细的技术优化方案并已迅速应用到产品中,针对时尚全品类比如上装、下装、鞋靴、包、手表、配饰等以及图书品类、绿植品等,我们将不断提升和优化算法,提升用户使用体验,并加强数码产品等标准商品的识别精准度。同时,京东目前已经在APP上增加使用提示,帮助用户在使用拍照购功能时感受到更好的体验,并通过该功能找到所需商品。”
图像识别技术在日常生活中的商业化应用主要有搜索引擎中的通用图片搜索和电商平台中的商品图片搜索。“拍照购”功能属于后者,是计算机视觉以图搜图技术的电商应用,其主要场景是用户通过拍照或截图方式,对非标准化商品和不易文字搜索的商品,比如时尚品、外文进口商品、奢侈品和美妆日用品等进行拍照并搜索视觉相似度高的商品。简单来说,通过智能手机终端和移动视觉搜索技术的结合,用户可以在街上、商店中、家中拍摄自己看到的商品照片,并在电子商务网站中检索对应的商品,主要是满足用户对“非标品”无法全面描述的痛点。
在复旦大学教授张军平看来,“拍照购”功能“翻车”挺正常,“理想环境和真实环境的区别”。
他与学生周晔基于阿里巴巴主办的一场由843支队伍参与的拍照购物大奖赛结果撰写的一篇论文于2017年发表。张军平说,图像识别率达到99.9%是在设定环境下完成的,而实际应用都是开放环境,涉及到光照、尺度、角度等的处理,还有目标分割、图像匹配、目标识别,“整个过程是一个系统工程,并非简单的图片识别”。
张军平分析道,拍照购物的难点在于用户拍照时,远近变化大、光照变化大、角度变化大、周边环境变化大,加上目标商品的视点和尺度的变化、遮挡、模糊等问题,这些都给拍照并准确识别目标造成了很大的困难。“除此之外,作为图片识别技术的一种,还有可能被攻击,导致人眼能识别对的,机器反而会看错。”
细想一下,淘宝的拍照购功能消费者使用得也不算多,至少仍旧会搜索文字进行“淘宝”。“目前图片搜索的速度还无法快于文字搜索,更多还在技术应用的宣传层面,离真正成为人们的主流搜索方式还有些距离。”不过,张军平教授对图片搜索技术看好,“图片搜索将是搜索的未来。”