在45年前再往前,曾经IBM的董事长认为也许未来世界人类可能需要五台计算机就够了。但是当45年前比尔盖茨创立微软的时候,他做出了一个巨大的预见,他认为这个世界上不是只有五台计算机,而是每一个人都会需要他们自己的计算机,并且在这些计算机上都会运行微软的软件。
鲁曼认为,这其实是“客服降级,减低成本,漠视用户权益”的表现。企业都希望将更多业务交给机器处理,以降低人工成本。很多互联网企业引导客户采用机器、自助服务等形式处理,机器人客服成为流于形式的幌子。
有行业内人士甚至认为,如果不是算命本身的合法性存在质疑,AI算命不失为一个有刚需、有市场的落地场景。“只要有焦虑,就永远有占卜的生存之地,而AI算命恰好能在尽可能不丢失准确性的情况下,把占卜的成本降到最低。”
噪声环境的各类声源处理是目前公认的技术难题,机器无法从各层次的背景噪音中分辨出人声,而且,背景噪声千差万别,训练的情况也不能完全匹配真实环境。因而,语音识别在噪声中比在安静的环境下要难得多。
智能客服体验差,错不在人工智能,而在于这项技术发展尚不成熟就投入市场,更在于商家只想着节省成本,却罔顾消费者体验。其实,这都是急功近利的表现,这些不重视售后体验的商家,看似省了钱,迟早也会对销售产生影响。毕竟,售后体验也是商品价值的一部分。
对于自动理解人类音频的任务来说,识别「谁说了什么」(或称「说话人分类」)是一个关键的步骤。例如,在一段医生和患者的对话中,医生问:「你按时服用心脏病药物了吗?」患回答道:「Yes」。这与医生反问患者「Yes?」的意义是有本质区别的。
用户如果不允许“默认开启麦克风”,这种“窃听”其实无法实现。对于那些压根没有语音功能却要求授权麦克风使用的应用程序,消费者尤其需要提高警惕。
为了让Alexa能更好地执行一些复杂的任务,亚马逊还推出了一项名为“预感”的功能,目的是为用户提供一些有用的建议。丹尼尔介绍道,“你可以在晚上用Alexa设定闹钟,说‘Alexa,定一个明早6点的闹钟’,这时Alexa会告诉你,‘顺便说一下,地下室的灯还亮着,要我把它关掉吗?”。
适合于智能语音交互的设备有很多,智能音箱之外,车载系统、手机、上网本、互联网电视甚至一些物联网设备都是很好的硬件载体。然而,不同的硬件意味着完全垂直的应用场景,所以看似硬件的问题,仍然是个软件问题。
而麻省理工学院的研究人员开发的新型人机接口“AlterEgo”则更为魔幻,骨传导耳机环绕用户的耳朵和下巴,计算机系统处理并翻译耳机接收的数据并输出反应,如同人们在阅读时的“默念”。
1993年,亚当的公司推出了第一个含有Siri概念的产品,它类似于一个平板,可以书写,并给你反馈答案。在最原始的版本里,Siri可以连接到42个不同的网页服务,从点评服务到购票网站再到影评网站等,然后从上述信息中返回一个答案,让用户不用打开另外一个应用,就可以享受订位、叫出租等服务。
风险投资公司Loup Ventures通过智能音箱对主流数字语音助手进行的测试显示,虽然Google Home仍然领先所有竞争对手,但其它产品的“智商”也有所提升。该公司又发布了《年度智能音箱智商测试报告》,通过谷歌Home、苹果HomePod和亚马逊Echo等智能音箱来关注这些数字助手的表现,结果很有趣。