【小哈划重点:在公共场合,智能垃圾桶会知道自己什么时候已经满了,公路会知道它们何时会裂缝,超市货架会知道它们何时被买空。每个系统都会把信息传给负责处理这个问题的人(或机器)。智能指示牌、路灯和交通指示灯将直接与经过此地的无人驾驶汽车进行交流。】
1
日益强大的系统
我们的生活正在被三大发展所改变:日益强大的系统、日益综合的技术和日益量化的社会。这些变化将带来一个崭新的、不同的集体生活——数字生活世界。当我们想象数字生活世界时,不妨把它想象成一个紧实而丰富的系统,它将人类、强大的机器和充足的数据连接在一张相当复杂精密的网中。
我们先从拥有超凡能力的计算机说起,这些超级计算机属于“日益强大的系统”范畴,它们将成为数字生活世界第一个决定性的特征。
1.人工智能
人工智能(AI)领域兴起于1943年,关注的是建设一种“智能的”数字系统。当我在此提到人工智能时,是在描述一种可以执行任务的系统,而这些任务此前被认为需要人类的认知和创造过程参与才能实现。它的进步并不是一帆风顺的,但它在当下的确大放异彩且迅速聚集。成千上万种以前只有人类才能进行的活动,如今被数字系统更快、效率更高、更准确地完成,人类的完成度根本不能与其相提并论。
人工智能系统已经快要超越人类在翻译自然语言、识别人脸、模仿人类说话方面的能力了。
在2016年,微软发明了一种人工智能语言识别系统,能够转录人类的对话,这个系统的错误数等于甚至少于专业的人类速记员。牛津大学的研究者们发明了一种准确率高达93%的人工智能“读唇语”系统,相比之下,专业唇语翻译人员的正确率只有60%。人工智能系统已经可以撰写体育、商业和财经方面的文章了。2014年,美联社开始使用算法计算上千份此前由人工撰写的收益报告,又生产了15倍于原数额的报告。人工智能系统已经导演了电影,制作了电影预告片。人工智能“聊天机器人”(能跟人聊天的系统)将很快用于餐馆点餐。使用人工智能的自动驾驶汽车被广泛期待在接下来的几年中普及。
每天,算法都会代表投资者在金融市场上进行无数次交易。投资者们相信,算法能够基于变化的市场状况制定复杂的战略。深度知识(Deep Knowledge Ventures)是一家总部位于中国香港的风险投资公司,该公司为其董事会指定了一套名叫VITAL(先进生命科学确认投资工具)的算法。
在医疗领域,人工智能系统在区分不同种类的肺癌并预测存活期上做得要比人类病理学家还好。研究者们相信,它们在区分与预测其他种类癌症的相应过程中的表现,也会优于人类病理学家。
在法律方面,一个人工智能系统正确判断了欧洲人权法院审理的上千个案例中79%的结果。致命自主武器系统,也就是人工智能支持的导弹、军用无人机和武器化机器人,也正在开发中。如果运用到战场上,它们将有能力基于特定的标准锁定并摧毁目标,随后返回或是自我摧毁——它们随时准备在适当的时候行动,不需要人类决策对其干预。
在国际象棋领域,IBM研发的深蓝在1997年战胜世界冠军加里·卡斯帕罗夫(Garry Kasparov)的比赛中一战成名。在2016年,Google DeepMind的人工智能系统AlphaGo震惊了世人,在古老的围棋项目上以4∶1击败了韩国围棋选手李世石,在此一役中,AlphaGo使用了令人眼花缭乱的创新战术,要知道,与国际象棋比,围棋的复杂程度要以指数倍计。李世石甚至有点心酸地指出:“我还是能赢一场的,我不会拿这场胜利去交换世界上的任何东西。”
一年后,另一个版本的AlphaGo——AlphaGo Master以3:0的净胜分击败了“地表最强”的人类围棋选手柯洁。如今,一种更加强大的版本出现了,那就是AlphaGo Zero,它连续100次击败了AlphaGo Master。
在2016年年底,一个Watson平台发现了5种与肌萎缩性脊髓侧索硬化症(ALS)有关的基因,这是一种能导致瘫痪和死亡的退化性疾病。这个系统吸收了所有已发表的有关ALS的文献成果,并剖析了人类基因组中的每一个基因。对Watson来说,完成以上工作不过是几个月的事,而如果由人类来操作,可能要花上好几年。在2017年年初,日本寿险巨头富国生命保险(Fukoku Mutual Life Insurance)裁员34%,转而采用Watson的“探索者”平台取代他们的工作,消化了好几万份医疗记录、证书和住院数据,以及用来计算投保人支出的手术信息。
人工智能已经产生了大量的次级领域,在每个领域都应用了不同方法来解决各种各样的问题。一些研究者立志寻求跟人类大脑一样的“通用人工智能”,这种通用人工智能天生具有意识、创造力和常识,以及在不同环境中都具备的“抽象思考力”。实现这个目标的途径之一也许是全脑仿真(whole-brain emulation),瑞士的蓝脑工程(Blue Brain project)就正在探索这种方法。这个工程尝试映射、模拟并复制人脑中的800多亿个神经元和十几万亿个神经突触,以及其中枢神经系统的工作情况。全脑仿真依然被看作一个遥不可及的愿景,但它在技术上并非不可能。正如伦敦帝国理工学院认知机器人学教授默里·沙纳汉(Murray Shanahan)所说,“将数以百亿计的超低功耗、纳米级的元件组合成一个有人脑智能水平的设备,人类大脑的存在就是这种技术可能性的证据。
然而,大多数当代人工智能研究并不关心通用人工智能或全脑仿真。相反,它旨在创建具有以下功能的计算机:执行某种特殊任务,这种任务往往是十分狭窄的,而其效用级别却很卓越。AlphaGo、深蓝和Watson并不具备像人脑一样的“思维”。拿深蓝来说,它只有下国际象棋的功能,使用“强大的数字运算能力”去处理每秒钟数以亿计的位置,去推测每个可能的下法,最多能算到二十步左右。
不过,对作为接收方的我们来说,不太可能去区分它到底是拥有通用智能的系统,还是使用50种不同的次级系统去给人以通用智能印象的系统,它们会产生同样的效果。
2.机器学习
当前人工智能最重要的子领域就是机器学习。佩德罗·多明戈斯(Pedro Domingos)在《终极算法》(The Master Algorithm,2015)一书中解释道,让计算机执行某项任务的传统方式是“写下算法”,即一系列向计算机发送的指令,以此“细致入微的细节去解释”计算机应如何执行这项任务。
相比普通算法,机器学习的算法能够自行找到识别模型、创建模型并执行任务的方法。它通过调动大量数据,识别模型并进行推断来完成任务。机器学习算法可以同时学习两种知识(“如果某物看起来像X即它是Y”)和技巧(“如果道路向左弯曲,则将车轮向左旋转”)。这个想法是,在某个特定时刻后,“我们不再需要为计算机编程”,而是靠“它们自己给自己编程”。
许多人工智能系统都采用了机器学习技术,确切地说,机器学习算法无处不在:
在亚马逊,算法决定了当今世界上的人们正在阅读何种书籍,算法在这方面起的作用远超任何一个自然人。美国国家安全局(NSA)的算法决定了谁是潜在的恐怖分子。气候模型决定了大气中二氧化碳的安全水平。选股模型比我们大多数人更能推动经济发展。
当你第一次乘坐自动驾驶汽车时,请记住:没有工程师编写算法一步步地指导它(自动驾驶汽车),手把手地教它怎么从A地行驶到B地。也没有人知晓如何对汽车编程,让它开动,也没有人需要做这些事。因为一辆配备了学习算法的汽车通过观察驾驶员的行为就能自行学会。
机器学习,借用多明戈斯的话来说,就是自动化本身的“自动化”。这是一项意义深远的进步,因为它让人工智能系统从它们的人类创造者的限制中摆脱了出来。
总体来说,机器学习算法有三种“学习”方法。在监督学习(supervised learning)中,人类程序员设置了一系列确定的结果并为机器提供反馈,告诉它们其判断是否与确定的结果相合。在无监督学习(unsupervised learning)中,机器将获得数据,然后自行寻找其范式。因此,一个无监督学习的机器可以用来“发现知识”,即建立人类程序员完全没有意识到的连接。在强化学习(reinforcement learning)中,机器被给予“奖励”和“惩罚”,从而告诉它做得是否正确。
机器实现了自我完善。
上文描述的很多先进技术,尤其是那些涉及图像、语言和文本的,正是那种所谓受到动物大脑结构启发的、利用“神经网络”进行的“深度学习”技术。谷歌在2012年开启了一项这样的技术,它融合了1000台大型计算机,创建了为数超过10亿的连接。1000万张随机产生于油管视频中的图片被提供给这台计算机。没有人告诉它去寻找什么样的图片,这些图片也没有被打过标签。三天后,一个单元学会了如何识别人脸,另一个单元学会了识别一只猫的面部图像。谷歌的工程师们如今利用“决斗”(duelling)神经网络去彼此训练:一个人工智能系统创造现实图像,另一个人工智能系统扮演批判者的角色,试图辨识出它们的真伪。
AlphaGo Zero是最新、最强大的GO-playing人工智能系统的化身,对它来说,最有吸引力的,并不是从与最杰出的人类对弈中“学习”,甚至也不是“学习”人类的比赛,而是从反反复复的自我对抗中“学习”:它从完全随机的步法开始下起,然后随着时间的推移快速成长。
而通过新算法的发展,更主要的是处理能力和可用数据的爆发性增长,机器学习在近几十年里迅速成长和成功。数据对机器学习来说是至关重要的,如果数据太少,机器学习算法的发展便会受阻,如果数据足够多,“一种只有几百行的学习程序就能轻松产生千万行的程序,而且它能在不同问题上反复使用”。这就是数据被称为“新煤矿”,而收集数据的人被称为“数据挖掘者”的原因。
不过,对有缺陷的现实世界数据的依赖也能对机器学习系统造成破坏。微软于2016年3月在推特上推出了人工智能聊天机器人Tay,它可以模拟一个19岁的女孩说话,并能从与其他推特用户的交流中学习。但Tay仅面世16小时,就被禁止继续运行,因其发布了一系列含有种族主义和色情内容的煽动性推文,其中还有一张希特勒的照片,照片上打着“前方高能”的说明。Tay从推特上其他用户的这种交流方式中“学习”了此类说法,这个例子表明,人类在社交媒体上如何表达,机器学习也能有样学样。
关于机器学习的最后一点是,在过去,为任何系统提供动力的计算能力(算力)实际存在于该系统中。强大的数字设备,实际上包含了使它们运行的处理器。在上个十年到来的云计算,意味着算力不一定要被局限于设备本身:像苹果公司的Siri可在网上被接通。这一点对技术的融合意义非凡,它意味着使用小设备就能调动起大型计算资源。这一点对机器学习来说同样重要,因为它意味着机器不需要从它们单独的经历中“学习”,它们也能从其他机器那里学习,以至在这个集群或机群中的每台机器都能为整体的“集体智慧”贡献力量。
3.算力的几何级数增长
人工智能和机器学习领域的进步源于数学、哲学和神经科学领域的进步。不过,它的进步总体基于两项大的发展:可用数据量的大爆发和算力的爆发式增长。
最近50年,算力——计算机芯片处理数据的能力——呈指数型增长,差不多每两年就要翻一番。一般而言,这个进展预计会持续下去。以当前趋势来看,到2029年,计算机的算力将比2017年要快64倍。如果技术以同样的速度继续进步,那么到2041年,它的算力将比2017年快4096倍。30年后,计算机将成长到比现在强大千万倍。
计算机的算力约每两年提高一倍的理论,通常被称为“摩尔定律”。这个原理最初来自英特尔公司的联合创始人戈登·摩尔(Gordon Moore)在1965年发表的文章,他在这篇文章中预测,能被塞到一个集成电路上的组件数可能会每两年大致翻一番。当时,摩尔预测,这种趋势将“至少持续十年”。其他人对他的预测持怀疑态度,觉得再能应验个几年就不错了。结果摩尔定律现已持续了50多年。
沃尔特·艾萨克森(Walter Isaacson)指出,这不仅仅是预言:它是“该行业的目标,在一定程度上帮助这个行业实现了自我”。有趣的是,算力并不是唯一以几何级数速度升级的技术。大量其他技术升级,包括硬盘容量、带宽、磁数据存储、像素密度、微芯片密度、随机存取存储器、光子传输、DNA测序和脑扫描分辨率都在不断发展。如果摩尔定律继续成立,那么在接下来的几十年里,我们都将得以目睹具有超级能力的机器。那是一个每台台式机大小的机器都有全人类的算力的世界,跟我们当下所处的世界完全不同。
有人会说摩尔定律会在接下来的几年中慢慢失去解释力,主要是因为它将在物理上变得不可能——很难将更多的晶体管塞入同一芯片中,当然,过去半个世纪的经济红利慢慢消耗殆尽也是其丧失解释力的原因之一,也的确出现了一些速度放缓的迹象。
然而,“当前的计算模式——将晶体管集成到硅的二维晶片上(集成电路)——就是最终的计算模式,并且本身不能通过其他方法改进”这一假设很有可能是错误的。历史、市场力量和常识都表明并非如此。在使用集成电路之前,计算机是单纯用晶体管组成的。在此之前,即阿兰·图灵(Alan Turing)的时代,人们依靠电子管、继电器和电机机械来造电脑。
计算的故事是一系列越来越强大的信息处理方法的故事,每一种方法都经历了几何级数的发展,随后达到其物理极限,然后就被更优秀的方法取代。对于摩尔定律来说,它并未随着集成电路的开始而开始,也不太可能随着集成电路的结束而结束。
许多新方法已经在开发中,旨在达到基于硅片的计算的前沿并超越它。一种方法是首次在芯片中使用非硅材料。另一种可能性则是脱离当前2D集成电路(晶体管被并排排列在一张硅晶片上)的范式,转为一种3D的方法——把硅晶片叠高。一种方法可能是完全放弃硅这种材料,转而采用碳纳米管作为材料来构建体积更小、效率更高的晶体管。目前还有一种方法被谷歌采用,即使用更多拥有特定目的的计算机芯片来实现特定的功能——功能更少,速度更快。微软正加大对一种可以兼顾更高速度和灵活性的芯片的使用力度。
放眼更长远的未来,来自谷歌和其他公司的工程师已经在努力开发“量子计算机”了,在处理某些任务上,“量子计算机”的功能预计将可以远超经典计算机。另一种可能的替代硅的方法是使用2D类石墨烯状化合物和“自旋电子学”材料——利用电子的旋转来计算,而非移动它们。神经电子学是另一个不断发展的领域,旨在对人脑的神经网络进行逆向工程,需要的功率或许比硅更少。从长远来看,量子点细胞自动机(QDCA)技术可能产生难以想象的小体积半导体,这种半导体能够在使用远少于硅的功率和耗能的情况下,完成晶体管的工作。
2
日益综合的技术
在数字生活世界中,技术将逐渐渗透进我们所处的世界,与我们的日常经验密不可分。以智能手机为例,据估计,超过90%的人的智能手机每天24小时都触手可及,距离不超过一米。63%的美国人每小时检查一次设备,接近10%的人每5分钟就要查看一次手机。很难相信我们只与智能手机共处了十年左右的时间。
数字技术的发展有五种潜在趋势:更无处不在,连接性更强,更敏感,更具构成性,更具沉浸性。
1.无处不在
首先,技术变得越来越无孔不入了。思科系统(Cisco Systems)上的互联网业务解决方案组预估,世界上99%的物体最终将被连接到网络上,在这样的一个世界上,算力将无所不在。
当你在家时,冰箱会自动监测你吃了什么,并随时清空你的线上购物车;烤箱和洗碗机会根据声控回应你的需求;当你在床上挣扎着起不来时,咖啡机就会自动给你冲好饮料。传感器将监测你家的温度和光感,相应地调整温度和百叶窗的开阖度等。你的房子可能会被使用指纹、面部特征和眼底扫描等生物学信息的“智能锁”所保护,从而控制进出人员。
穿上一件“科技Polo衫”(PoloTech),它就能监测你的步数、心率和呼吸强度——为你提供个性化的反馈。“表皮电器”——穿在皮肤上的小型弹性补丁——将能够记录你的日照量、心率和血氧含量。同时,当你在花园里抛出一个球,这个球的球皮本身就能记录它运动的距离、速度、旋转度、螺旋度和捕获率,以供赛后分析。
在公共场合,智能垃圾桶会知道自己什么时候已经满了,公路会知道它们何时会裂缝,超市货架会知道它们何时被买空。每个系统都会把信息传给负责处理这个问题的人(或机器)。智能指示牌、路灯和交通指示灯将直接与经过此地的无人驾驶汽车进行交流。大量的“智能城市”将会成长起来。肯塔基州的路易斯维尔市政府已经将GPS(全球卫星定位系统)追踪器植入空气吸入器,以测量城市中哪些地区的空气污染程度高。
2.连接性
技术在渗透进现实世界的同时,还将拥有更强的连接性,增强人与人之间、人与机器之间、机器与机器之间的信息交换。自从千禧年之后,联网的人数便快速增长,2000年的上网人数为4亿人,2016年,这个数字变成35亿,到了2021年,全世界的上网人数已达到49亿。似乎,这个地球上的大部分人口最终都会被连接到一个以无线网为基础的网络之中,不仅仅是通过台式机,而是通过“智能设备”、智能手机、平板电脑、游戏机和可穿戴设备。
数字技术在改变人类连接方式本质的同时,还改变了程度。也许,最重大、最深远的变革就是去中心化的生产和分发信息、文化与知识的模式。维基百科就是这种去中心化生产最著名的范例。来自全世界的数十万写作者精诚合作,共同生产、组装了这个最大的人类知识宝库,他们做这件事并不是为了谋利,而且身处市场体系之外,也非响应国家号召。
正如尤查·本科勒(Yochai Benkler)在《网络的财富》(The Wealth of Networks,2006)和《企鹅与利维坦》(The Penguin and the Leviathan,2011)中所说,在过去的二十年中,人类变得更加善于合作,这并非出自人性的改变。而且,这种程度的合作行为,在人类过去的历史上是不可能出现的,使如此大规模的合作行为成为可能的是连接技术。
近几年,另一种有可能对连接与合作产生深远意义的技术开始兴起,它就是区块链。区块链最广为人知的事迹是作为在2009年启用的数字加密货币——比特币的支持系统。区块链的运行方式在技术上很复杂,但是它的基本假定却能被简单地描述出来:
想象一个巨大的数字账户(或电子表格),就像我们以前用的纸质表格,这个账户包含其所有使用者之间发生的所有转账记录。每过几分钟,它就会更新一次,用包含最近10分钟里全部转账记录的信息“块”来更新其区块信息。每个新的区块都返回到上一个区块,从而建立一个不间断的连续资产托管链,所有资产都可以追溯到它们的初始阶段。这个账户不会存储在某个单个的位置。相反,它被同时存储(“分发”)到全世界数以万计的计算机上。为了安全起见,它只能被添加,不能被修改;它是公开的,可以接受审查;最重要的是,在其上发生的交易由强大的“公钥”加密技术保护。
区块链的社会意义在于它可以在陌生人之间实现安全交易,而无须可信的第三方中介,如银行、信用卡公司或国家。它意图解决计算机科学(和政治学)中长期存在的问题:在没有通常所说的“人际关系”的人与人之间,如何建立起“信任”之类的东西。数字货币也许是区块链技术最知名的应用,但是从理论上来说,它几乎能被用来记录一切,从出生、死亡证明到结婚证。它也可以为数字生活中的其他问题提供解决方案,像如何生产和保持对安全的数字“钱包”或账号的控制。展望未来,有理由想象“智能”财产可以通过把人工智能和区块链结合起来的方法来自我管理:“备用卧室、没人住的公寓或是没人用的会议室,都能把自己租出去......自动化的中介能够管理我们的住宅和办公场所......”
区块链还为规范除简单的财产权或使用权之外的、更复杂的法律和社会关系提供了可能的解决途径。例如,一份“智能合同”,就是一个能在预先达成一致的前提下自我执行的区块链软件,就像一份能把车辆所有权自动转移至顾客名下的买卖协议,它还能同时搞定所有的贷款支付。这就是早期的“去中心自动化组织”(DAOs),它们寻求在没有中心权力结构的情况下解决集体行动的问题。设想类似优步和爱彼迎的服务,它们实际上是没有任何中心化的正式组织在幕后运作的。
越来越多的连接技术不仅与人和人之间的联系有关,还与增加人和机器之间的连接有关。未来,当你离开家时,“你与你家的吸尘器或机器人宠物之间的对话将通过你的无人驾驶汽车无缝对接,就像一个‘人’居住在所有这些设备里一样”。自动驾驶汽车之间将能相互交流,从而尽量减少交通流量并避免撞车。在家中,蓝牙网格技术可以越来越多地用于把各种“智能”设备连接起来,使用附近的每台设备作为范围增强器,在电子设备之间建立一个安全的网络连接,而此前有些设备可能不在网络的范围之内。
再往前看,硬件的发展可能会产生新的、令人惊讶的通信方式。在2014年,有人用脑电图(对大脑活动的记录,又被称为EEG)耳机成功地将“想法”发送给了佩戴类似装置的、能够理解这一信息的人。这是第一个“思想到思想”传递信息的科学实例,也被称为“心灵感应”。
总体而言,越来越多的连接技术似乎有望实现万维网的发明者蒂姆·伯纳斯·李提出的愿景:“任何事物都有可能与其他事物连接起来。”
3.敏感性
可以预见,我们周围的世界将充斥着越来越多的传感器,随之而来的还有这些传感器探测能力的大幅增长。这就是越来越敏感的技术。我们的手持设备已经包含能测量声音大小的麦克风,能确定位置的GPS芯片,能够捕获图像的照相机,还有其他种类的传感器。与此同时,我们周围的设备将越来越多地使用雷达、声呐、激光雷达(自动驾驶汽车发射激光来测量自身与物体距离所用的系统)、运动传感器、条码扫描器、湿度计、压力传感器、磁力计、气压计、加速度计和其他感应方式,以此与物理世界互动。
人们想要在家中和自己使用的设备上安装传感器的理由有很多——譬如用GPS找回丢失或被偷走的物品,或者远程监控家中的安全或温度状况。实体工业也能从其机器在湿度、气压、电阻率或化学状态方面的实时反馈中受益。运输及配送公司可以监控工作量和其运输线上的压力大小。工程和建筑公司可以衡量腐蚀速率和应力。同样,在供水系统中,传感器可以测量水质、水压和流量,从而实现实时的管道管理与维护。自动读表技术将使用情况的数据反馈给公用事业提供商,供他们发现故障,促进供需匹配并自动发出账单,很少或几乎不需要人工干预。
市政机关已经认识到“密集传感器网络”的价值,它可以实现“跨系统或地区的不同条件的监视”。自动车牌识别技术可用于跟踪跨越城市的车辆,并对其违反交通规则的行为处以罚金。西班牙的桑坦德市已经在城区各处配备了12000个传感器来测量“噪声、温度、环境光照水平、一氧化碳浓度以及停车位的位置和可用数量等”。在阿富汗时,美军留下了1500个“无人值守地面传感器”来监视阿富汗和巴基斯坦的人口流动。
一项名为“地下世界”的试点研究试图利用“被冲进马桶的数据”。这项研究设想让小型机器人穿过下水道去收集样本,分析测量人们的食物摄入,以及传染病和胃部健康情况。
传感器也将扩张触角伸向了此前只能被生物体验到的传感领域。例如,一家公司正在开发一种能够“闻”和“尝”的移动化学传感器。有用之处是,你的智能手机将能够测试你血液中的酒精水平、血糖水平以及你是否患有口臭,需要使用大约2000个传感器来检测香气和风味——其数量远超人类鼻子中的400个传感器。
在机器视觉领域,人工智能系统能越来越精准地找到图像中最重要的部分,并就其“看到”的东西生成准确的文字说明(例如“人们正在户外市场购物”)。计算机人脸识别如今也十分先进,在欧洲和澳大利亚,它已经被用于常规的边境安全检测。
与我们关系最密切的敏感型技术将直接从我们的身体里收集数据。普罗特斯生物医药公司(Proteus Biomedical)和诺华(Novartis)已经开发了一种“智能药片”,它可以告诉智能手机,你的身体对药物的反应如何。神经义肢的开发目前仍处于早期,它直接与神经组织相互作用。植入瘫痪病人运动皮层的芯片使其能通过意念移动屏幕上的光标,从而拼出单词。
一项对800名世界经济论坛高管们的调查发现,他们之中有82%的人预计第一款可植入智能手机将在2025年实现商业化使用。届时,智能手机将真正像美国最高联邦法院首席大法官约翰·罗伯茨(John Roberts)所说的那样,成为“人体解剖学的重要特征”。
机器正在更重要的意义上变得敏感起来,因此它们越来越有能力去窥探人类的情感,这便是情感计算领域。这种系统能通过观察人脸实时判断此人是否快乐、困惑、感到惊讶或恶心。一位开发商声称已经建立了“世界上最大的情感数据库,存储着近400万张人类面孔”,该系统已经从这些数据中学会了解释微妙的情感暗示。
拉菲·哈特查杜安(Raffi Khatchadourian)在《纽约客》中这样写道:现在,计算机在区分社交用户的笑容是否发自内心的喜悦上,已经超过了大多数人类,它们还能区别假疼和真疼,确认患者是否正处于沮丧之中......它们还能记录转瞬即逝的表情,即使是做出这些表情的人类本身都难以意识到它们的存在。
情感计算标志着人类和机器之间的关系发生了精神上的巨变,人脸不再是进入、窥探我们内在生活的唯一门户:例如,情绪的表达可以通过肢体动作监测,譬如使用陀螺仪传感器,又譬如使用压力感应椅子监测姿势的变化,还可以使用皮肤导电电极捕捉汗液或电阻的指示性变化;甚至还可以从人类的眨眼模式、头部倾斜角度和速度、是否点头、心率变化、肌肉紧张程度以及呼吸频率进行情绪判断。电波活动监测也可以用于判断人们的情绪状态。
机器如今完全可以监测到这些信号。例如,通过监测一名女子和一个孩子之间对话的音调、节奏和强度,就能确定该女子是不是孩子的母亲。麻省理工学院的研究人员表示,通过将普通的WiFi信号反射到人体,能够确定一个他们之前从未研究过的人在70%的时间里的情感状态。这个百分比会随着该系统对此人了解程度的增长而增长。
另一个生物特征是人的步态(行走的方式),人工智能系统可以以此从远处识别一个它已经“认识”的人类,甚至可以识别出系统“完全不认识”的人的可疑行为。
机器不仅可以读取我们的情绪,还可以逐渐适应并回应我们的情绪。这就是情感人工智能(artificiale motional intelligence),它的用途多种多样——自动提款机能看出你的情绪是否处于放松状态,以此确定你是否愿意接受广告;装有“面孔”和“眼睛”的人工智能“伴侣”则能以“看上去有感情的方式”回应你的需求。技术人员正在努力复制人们之间最亲密的关系,塑造能够说出性感话语、制造性感气氛的人工智能爱侣。
4.构成性
越来越多的构成性技术——实体存在于坚硬的、由原子构成的物理世界中,而并非只是由二进制数字构成的“网络”世界中的数字技术。这在很大程度上是“机器人学”领域的问题。
现代机器人科学仍然是一个充满挑战的领域,部分原因在于“莫拉韦克悖论”(Moravec’s paradox),即(也许与预期相反)高层次推理只需要少量的计算,但低层次的感觉运动技巧则需要大量的计算资源。因此,比起使机器具备人类或动物的平衡和运动能力来说,设计解决问题的机器总是更加容易的。我们仍然没有造出值得信赖的理发机器人。
然而,全世界的机器人数量如今已超过1000万,其中有100万机器人正从事着有益的工作(如制造一辆汽车,80%的工作是由机器人完成的)。亚马逊拥有15000多个机器人,它们看上去就像是一批流动的脚凳:从库存中拿出货物,然后将其送至人类雇员处。在日本,有90%的农作物喷粉都是由无人机完成的。2016年,约有30万个新工业机器人被组装起来,机器人科学领域的全球投入,在2025年有望比2010年的同类投入高出四倍以上。
我们已经相信机器人系统可以执行复杂且重要的任务。在这些任务中,最重要的便是外科手术。美国一个外科医生团队使用先进的机器人技术,隔着近6500千米的大西洋,成功移除了一名法国妇女的胆囊。
无人驾驶汽车将来或许会成为最常见的机器人,能够“安全地在现实世界中行驶,不用担心它们会像人类一样疲倦或分心。谷歌的自动驾驶车队已行驶了超过320万千米的里程,其间只出现过少数几次状况,据说其中有一次还是车辆本身出了点问题。鉴于在所有撞车事故中,至少有80%的事故是由人为错误造成的,安全性的提高将是使用无人驾驶汽车的主要优势之一。
近来,机器人运动方面的进展,其灵感多来源于大自然。一些机器人可以“自我拆卸后再重新组装起来,有时还会组装成新的形状——比如一条蠕虫(可以穿过狭窄的管道),或者组装成球状或多足生物状(分别适用于水平或粗糙的地面)”。在哈佛大学,研究人员正在研究“机器蜜蜂”(RoboBees),它们的长度不到2.5厘米,重量不足0.1克。这些机器蜜蜂使用“人工肌肉”,在加强电压时,构成这种人工肌肉的材料就会收缩,其潜在的应用包括农作物授粉、搜索和救援、监视和绘制高分辨率的天气和气候图。
对“机器蟑螂”,还有“机器蜘蛛、机器蛇、机器蜻蜓和机器蝴蝶这些能飞、能爬、能跳进山洞或岩缝,深入敌后的机器动物”的研究也正在开展中。“软体机器人技术”领域的研究人员已经开发出了“章鱼机器人”(Octobot),这是一种拇指大小的自动软体动物,它由软硅橡胶制成,体内无任何刚性结构。
陪伴成了机器人越来越重要的功能。丰田手掌大小的机器人Kirobo Mini旨在激发与人类婴儿相似的情绪反应。Paro是一个可爱、活泼的互动小海豹,有着“迷人的黑色眼睛和茂密的睫毛”,它似乎对老年人和痴呆症患者有益。
2016年的诺贝尔奖化学奖授予了另一个新兴的研究领域——纳米技术领域。其设备构造单位小到纳米级别(一纳米等于十亿分之一米)。纳米级指的是大小在1-100纳米之间的尺寸。相比之下,红细胞的宽度为7000纳米。纳米技术的可能性令人难以置信:纳米机器人已经可以“游过我们的身体,传递图像,投递靶向药物,准确攻击特定细胞;与纳米机器人相比,人类最优秀的外科医生的手术刀都显得钝了些”。
还有可以根据人类的思想活动来释放药物的纳米机器人,有希望准确检测并预防癫痫的发作。纳米技术对数据存储也很有意义。荷兰代尔夫特理工大学的研究人员创建了一个“原子硬盘”,它只有约6.5平方厘米,却能存储500太比特(terabits)字节的内容。换句话说,它只需要一个边长为0.1毫米的立方体,就能存储美国国会图书馆的全部内容。
另一种构成技术是3D打印,也称为“增材制造”,它使我们能够根据数字设计来打印实物。有人认为这可能预示着“案头制造业”时代的到来——人们使用3D打印机,在家或办公室就可以“打印”各种物体。
目前公认最有用的3D打印物有相当一部分被用于医学领域。打印治疗四肢骨折的夹板相当常见,而打印一个定制的替代气管只需要不到15分钟。外科医生用3D打印打印出支架、假肢,以及据称是可代替人类颅骨的部件。康奈尔大学的研究人员甚至打印出了一个人耳。人的肾脏、肝脏和其他器官以及血管的3D打印均在研发中。打印的嵌入仿生技术的外骨骼后也恢复了行动能力。
除医学领域外,3D打印机也被用来制作全尺寸的仿制摩托车、比基尼、飞机零件、整栋房子和合成化合物(即药物),还复制了一批16世纪的雕塑。食品是3D打印的成长领域之一,巧克力、糖果、比萨、馄饨和鹰嘴豆块等都在打印“菜单”上。最终,预计会有大量材料用于3D打印,包括塑料、铝、陶瓷、不锈钢和高级合金,这些材料的生产曾经几乎需要整个工厂来完成。“4D”打印同样也在发展中,旨在创造出可以随时间改变形状或性质的材料。
5.沉浸性
随着增强现实和虚拟现实的发展,技术将从根本上变得更具沉浸性。
20世纪中叶的计算机像是一个“房间”,如果想使用计算机,就不得不先走进这个房间,同理,编程就跟使用螺丝刀差不多。之后,“桌面”成为人机之间的主要接口,在桌面上,我们先是通过键盘,后来又通过鼠标等方式来操控屏幕上的信息。而现在,我们正处于一个“玻璃平板”的时代。
“增强现实”(简称AR)是指计算机生成的声音、图形、视频等增强了我们对物质世界的感官体验。智能眼镜让佩戴者体验覆盖在现实世界之上的数字影像,目前仍处于发展的婴儿期。这些影像也许会显示前往公园的路线,或者是一个新衣柜的组装说明,也能用来识别野生花鸟。
在听觉增强现实领域,谷歌已经开发出了可以翻译的耳塞,基本能做到提供40种外语的实时翻译。最有名的早期增强现实应用是Snapchat的Lenses,它允许自拍者使用动画和滤镜编辑自拍照片。
另一个杰出的应用是智能手机游戏《神奇宝贝》,它在现实世界之上覆盖了捕捉和训练“神兽”的桥段。在《神奇宝贝》中,在数字终端上闲逛并不能带来胜利,玩家必须寻找在物理空间、现实世界中的荣耀。
虚拟现实(VR)仍在不断给我们带来更多深远的变革。戴上VR耳机,你会被带进一个生动的三维世界。触摸控制器带你感受自己的身体,“触觉”衣通过遍布身体的微小振动电机给你感官上的反馈你。一旦进入虚拟现实的世界,你就可以自由地观看、感受和探索这个新维度的存在并与其互动。
与在现实世界中运作的增强现实技术不同,虚拟现实技术是一种全新的模式。虚拟现实技术会让人感觉非常真实。用户经过最初的调整或是抗拒后,就能开始慢慢适应他们周围的“新宇宙”。随着时间的流逝,人们最初那种难以置信的感觉会逐渐消失,同时开启对这个“真实”世界的感性记忆,就好像有些东西正在分离,开始褪色似的。
根据本人的亲身体验,可以肯定的是,就算是简单的赛车游戏,也能激发出人们发自内心的振奋和恐惧。在测试早期的虚拟现实赛车系统时,我的“座驾”突然脱轨,冲向钢制路障。在那一瞬间,我真的觉得自己死到临头了(不管是不是真的,我还是第一次体验世界在眼前崩塌的感觉。)。记者们曾谈到过在虚拟现实中受到性侵犯的感觉:即便身体上经历的“上下其手”不是真实的,但它还是会引起持久的惊吓和被侵犯的感觉。
如今提到虚拟现实,大部分人仍把注意力放在游戏领域,但是在适当的时候,虚拟现实将被用来体验生活领域的方方面面。工人能出席虚拟会议,购物者可以在虚拟超市中选购物品,体育迷能经常光顾虚拟体育场,艺术家在虚拟现实中搞创作,政治哲学家在虚拟咖啡馆中高谈阔论,历史学家将在虚拟的战场上徘徊考察,社交名流可以在虚拟酒吧里流连。
重要的是,每个场景下的体验都不会被“现实世界”的条条框框所束缚——虚拟现实将造就一个全新的世界,在那里,常规(法律、规范,甚至是物理法则)都会失去效用。想象一下,在虚拟现实中,宇航员正在与一艘外星飞船激烈战斗,羚羊在塞伦盖蒂草原狂奔,乌贼在深海畅游。这并不是要人为制造真实的幻境,而是让幻境看起来更真实。
最终我们可能生活在一个“混合”的现实之中,先进的增强现实和虚拟现实技术让数字世界和现实世界变得难以区分。在这样的世界里,识别“技术”的起点和终点是很难的,而且很可能是徒劳的。
3
日益量化的社会
在数字生活世界中,越来越多的社交活动将作为数据被捕捉和记录,随后由数字系统进行分类、存储和处理。人类的动作、话语、行为、关系、情感和信念将越来越多地留下永久或是半永久的数字标记。除了记载人类生活的数据,自然界、机器行为和建筑环境等方面的有关数据也会被逐渐收集起来。
反过来,所有这些数据将用于商业目的,训练机器学习人工智能系统,预测和控制人类行为。这是一个日益量化的社会。
21世纪以来,人类和机器生成和处理的数据呈爆炸式增长。现在,人类每隔几个小时产生的信息量差不多等于从人类文明诞生到2003年间所产生的所有信息量。我们如今每10分钟产生的信息量就等于最初一万代人类创造的信息量总和。我们生产信息的速度预计会像计算机处理能力一样继续呈几何级数增长。
那么,到底什么是数据?它们都来自哪里呢?
《大数据》(Big Data,2013)一书中解释道,数据“是对某种事物的描述,它使对这些事物的记录、分析和重组成为可能”。将现象转化为数据的过程被称为“数据化”。我们已将地球上大量的活动进行了数据化和数字化(转换为机器可读的二进制代码)。2000年时,世界上只有约三分之一的信息是以数据形式存储的,如今,这一比例已超过98%。
有四个因素促成了这个过程。第一,越来越多的社会活动通过数字系统或数字平台展开,可供收集的数据就更多了。第二,在过去50年中,存储数据的成本每两年左右就减少一半,而其密度却增加了5000万倍。第三,算力的爆炸式增长使我们有能力处理存储的内容。第四,数字信息的复制几乎没有边际成本,它们可以相当廉价地复制数百万次。这些因素共同解释了为什么从基于印刷的信息系统过渡到数字化系统的过程中,就产生了如此大规模的数据爆炸。
比较当前的发展和上一次“信息革命”——大约六百年前,约翰内斯·古腾堡(Johannes Gutenberg)发明了印刷术。在古腾堡发明印刷术后的50年中,800多万本纸质印刷书籍问世。学者伊丽莎白·爱森斯坦(Elizabeth Eisenstein)认为这个变化是“革命性的”,因为这很可能意味着此后半个世纪中印刷的书籍量将比过去一千二百年中“欧洲所有抄写员”录过的手抄本还多。然而,在古腾堡所处的时代,倘若需要50年左右的时间才能让现存数据量翻番的话,现如今,同样的壮举大约每两年就能实现一次。
世界上的大部分数据都是人类产生的。很多时候,我们在使用各种设备进行记录和交流时,会故意让这些数据产生。我们每天发送约2690亿封电子邮件(每人约36封),向脸书上传3.5亿张照片,发布5亿条推文。即便在看上去没有足够数据量的情况下,这些交流行为也能用此前被认为不切实际的方式去捕捉人类自身的生活情况。甚至像推特这种最初被限制在140个字符之内的、似乎不值一提的信息,也包含着看似相当丰富的信息。它包含了33项元数据(“关于信息的信息”),总体上也是相当能说明问题的:
一项研究分析了来自84个国家/地区的240万人在两年中发布的推文,共计5.09亿条,结果显示,尽管世界各地的文化不同,人们的情绪却每天/每周都遵循着相似的规律——在情绪被数据化之前,人们从未注意过这一点。
有些人有意选择远离社交媒体平台,监测自己身体产生的数据——通常是出于健康原因,但有时也是出于好玩或者好奇。一个小组的成员除了监测呼吸频率和脉冲外,还有如下计划:
全面记录生活日志并创建个人经历的统一数字记录......一个连续的、可搜索且能用来分析的、对过去的记录,包括每项行动、每个事件、每段对话、每个到访过的位置和个人生活的物质表现,以及体内的生理状况和外部条件(如方向、温度、污染水平)。
自然,这些身体数据也共享给了以上设备的制造商。我们选择如此,就意味着身体最深层次的运作过程现在就可以做到完全数据化,甚至包括DNA中包含的信息。在2003年,解码人类基因组需要“十年高强度的工作”,如今,同样的工作在一天内就能完成。
即使并非有意识地要创建或囤积数据,我们的日常生活也能排放不少“数据垃圾”。我们留下的“数字化足迹”被身上或身边的各种设备秘密地收集起来,譬如相当日常的税收和通话记录。其他情况则并非如此,例如智能手机上的应用程序,即便在我们完全没使用的时候,也会用GPS追踪和记录我们的位置。根据马克·古德曼(Marc Goodman)的说法,80%的安卓应用程序都是以这种方式运行的。约有82%的应用程序会跟踪用户的一般线上行为。
每秒钟,谷歌都能收到人类提交的60000多个搜索请求,每天的搜索请求数超过35亿。这些请求连同谷歌掌握的搜索者身份信息,都会被输入谷歌日益庞大的信息仓库中。如果把谷歌在一天中处理的数据印成书摞起来,其高度要大于地球与月球间距离的一半。这还只是每天的数据。
最后,机器生成的数据越来越多。其中的一些机器简直就是不断喷射海量数据的大怪兽。欧洲核子研究组织(CERN)的大型强子对撞机在启动时,每秒钟能产生40万亿字节的数据。在2000年投入运营的最初几周,斯隆数字巡天望远镜收获的数据,就比此前天文学史上收集的所有数据还多。
未来,最大的数据来源将是广泛分布于地球各个角落的各种设备。就连中档汽车都包含了多个微型处理器和传感器,允许它们在维修车辆时上传性能数据给汽车制造商。2005年,来自机器传感器的数据占全球总数据的11%,到2020年,这个数字增加到42%。
数据科学家一直在努力地通过清洗、处理和组织等方式,将原始数据转化为信息,然后对它们进行分析和解读,再将其转化为知识。大数据时代的到来需要一些方法上的创新。
在20世纪90年代,IBM推出了Candide,它致力于自动化语言翻译,采用的语料来自加拿大议会十年间的高质量文件。谷歌从2006年起开发其翻译系统,它另辟蹊径,从全网抓取更多的文档,这个芜杂的数据集收集了约950亿个英文句子,质量较差或中等的翻译也在列,其性能却远胜过Candide拥有的300万个经过精心翻译的英文句子的资料库。这并不是说谷歌最初使用了多么优越的算法,不同之处在于其未过滤的、不完美的数据集比Candide的数据集要大数万倍。谷歌的方法是将语言视为“用来判断概率的混乱数据”,这被证明是一种更有效的方法。
数据是有价值的,在一个地方收集的数据越多,就越能增加它的价值。
脸书的商业价值主要在于它从用户处收集的数据,这些数据用途十分广泛,从定向广告到搭建面部识别人工智能系统。2012年,脸书上市,其每个用户的个人资料估计对该公司来说值100美元。后来,它著名的“图书推荐”(算法推荐而非人工推荐)推出后明显提高了图书销量,亚马逊则解雇了旗下所有书评人。这就是数据被称为“商业原材料”“生产要素”和“新型煤矿”的原因。随后的热潮催生了一个价值数十亿美元的行业,这个行业“什么也不做,专门买卖人人共享的线上个人数据”。
日益量化的社会是一个更容易通过机器和控制机器的人来检查和分析的社会。随着越来越多的社交活动以数据形式被捕获,具有卓越计算能力的系统将构建出更加细微丰富的人类生活数字地图——体量巨大、极致详尽并实时更新。这些示意图虽说是从现实世界中抽象出来的,却忠实反映了现实世界。
而信息与控制之间一直存在着紧密的联系。在一个日益量化的社会中,这种联系就更加重要了。
从理论上讲,我们可以停止正在进行的创新,数字生活世界因此就永远不会到来。但这不太可能。创新是由强大的个人和共同的人类渴望驱动的,人们渴望繁荣、安全、便利、舒适和连接,这些都被一个为刺激和满足这些欲望而设计的市场系统所供养。
未来,我们的生活主要在这些新技术生成的世界的范围内展开,相伴而来的是集中于如何使用、拥有、控制和分配这些新技术的争议,而不是能不能把“精灵”塞回“神灯”里。
《算法的力量》作者 | [英]杰米·萨斯坎德,译者 | 李大白
(编辑 | 谢芳 瞭望智库。摘编自理想国2022年1月出版的《算法的力量》,原文有删减,不代表瞭望智库观点。)
(文章标题为哈希力量所加,插图未收录)