【小哈划重点:与其说考虑机器是否会取代人类医生,不如说我们正用机器不断创造新工具,帮助医生更好、更高效地完成工作,将医生的劳动力充分释放,让他们投入到要求更高的工作中去......2001年皮克斯出品的动画电影《怪兽电力公司》中,主人公小女孩阿布身穿的粉红色睡衣、“怪兽”苏利文身上软乎乎的蓝色皮毛,均通过基于可变形模型的计算机模拟生成。】
“人工智能是一门涉及广泛的学科,有包容万物的胸怀。”
德米特里·特佐普罗斯(Demetri Terzopoulos)来过上海多次。在刚刚结束的2019世界人工智能大会上,他在题为“智汇健康·预见未来”的分论坛上带来了主题为“人工智能在视觉计算和医学领域应用”的演讲。
在此之前,今年7月他在北京大学前沿计算研究中心的一场报告中,带去的演讲主题则是“神经肌肉和感知控制的人体仿真与深度学习”。
事实上,这位有着英国工程院院士、加拿大科学院院士、美国计算机协会(ACM)院士、美国电气和电子工程师协会(IEEE)院士、加州大学洛杉矶分校(UCLA)杰出教授等多个头衔,被誉为“计算机视觉领域奠基人”的“泰斗级科学家”,其实有着颇为广泛的研究兴趣:计算机图形学、计算机视觉、医学成像、计算机辅助设计、人工智能……过去40多年中,围绕这些领域他已发表了300 多篇研究论文和多部学术著作。
有些出人意料的是,由于他在“弹性可变形模型”(Elastically Deformable Models)领域杰出的研究贡献,2006年他获得了美国电影艺术与科学学院颁发的奥斯卡技术成就奖。《怪兽电力公司》、《星球大战》、《哈利波特》、《指环王》、《特洛伊》等享誉全球的影片中都有“可变形模型”的技术贡献。正如他自己所说,“人工智能是一门涉及广泛的学科,有包容万物的胸怀。”
在世界人工智能大会的主题演讲前夕,解放日报·上观新闻记者独家专访了这位依旧年轻的“泰斗”。刚踏进采访室,特佐普罗斯正坐在沙发上使用iPad。“可以开始采访吗?”“稍等,一分钟就好。”于是,一阵飞快地点击屏幕后,特佐普罗斯把iPad往茶几上一放,露出笑容:“开始提问吧。”
(一)与其担心机器取代医生,不如为己所用
此次特佐普罗斯带来的演讲题目与他近期的研究息息相关。由于近年来图像识别技术的飞速发展,加之世界范围内积累了大量医疗数据,医学影像便有了巨大的驱动。而计算机视觉技术在图像分割、配准、图像的重构、建模、运动模型分析、辅助诊断、治疗过程跟踪等方面,都能为医护人员释放巨大的劳动力。
上观新闻:您最近提到,深度学习正为包括计算机视觉在内的许多领域带来变革。事实上,过去的视觉影像模型都是由人类发现,而现在人们通过训练机器来“学习”模型,甚至构建模型。您觉得有一天机器会取代人类,成为新模型的构建者、发现者吗?毕竟机器的学习速度和效率都远高于人类。
特佐普罗斯:这个问题可以这样来看:过去放射科医生做的许多工作其实都很琐碎,比如要查阅、分析无数张X光片,这些都靠人工完成。尤其是图像分割(Segmentation),这是一件非常琐碎的工作。相比之下,机器就很擅长处理这些繁琐、重复性工作,这是机器对医生的日常作业产生的一个很重要的潜在影响。
然而,我觉得与其说考虑机器是否会取代人类医生,不如说我们正用机器不断创造新工具,帮助医生更好、更高效地完成工作,将医生的劳动力充分释放,让他们投入到要求更高的工作中去。
上观新闻:您的演讲中提到,现在医学影像已经由数据驱动(Data-driven),包括您30年前发现的“可变形模型”,现在也通过对数据的训练来不断精益。所以,数据驱动的医学影像和传统医学影像,两者最大的不同是什么?这些不同对人类尤其是病患来说,有哪些影响?
特佐普罗斯:数据驱动的方法中包括了很多机器学习技术,这些技术来自对数据的不断训练。比如在医学影像领域,以前许多影像都靠医人工去分割,现在我们尝试让机器从海量的影像中学习医生分割影像的手法。
但获取海量的医学影像并非畅通无阻,需要考虑病患的隐私安全,避免个人信息泄露。因此,数据的获得、选取以及决定究竟要让机器学习哪一部分数据,都需要充分考虑,也需要一定成本。
还有一点要说明,通过大量的数据训练达到机器学习目的,这在医学影像领域目前仍是小范围探索,并没有扩张到整个医学领域。但在其他社会领域,机器学习技术有机会迅速大面积普及。比如人们现在经常获取社交网络数据并进行分析,辅助商业、学术、城市管理等工作。这一类数据不仅数量庞大,并且大多都很有用。但在医疗领域,训练数据不是一件那么容易的事。
(二)人工智能正在改变科学家研究方式
1987年,特佐普罗斯与研究伙伴合作提出了著名的“主动轮廓模型”,通过识别物体轮廓,用不同颜色的线条勾勒出轮廓平面,然后使用图像分割法进行3D重建。由于重建后的模型富含各种弯弯曲曲的线条,这一模型也被称为“Snakes”,即中文里的“蛇”。
“Snake模型”的提出不仅使各种基于主动轮廓线的图像分割与识别方法蓬勃发展,也非常有力地推动了此后人们在神经网络方面的研究——神经网络,正是人工智能最核心的研究领域之一。
1997年,加拿大约赫湖,右二为特佐普罗斯
上观新闻:若现在回顾一下您的研究历程,您是否曾意识到,三、四十年前您的一系列发明发现,其实就是今天我们所说的“人工智能”,只是当时人们还没意识到这一点?
特佐普罗斯:的确如此。人工智能其实在上世纪50年代就已经诞生,到了60、70年代,开始大量运用于医学领域。我在上世纪70年末代开始研究医学影像分析,在那个年代,模式识别法(Pattern Recognition Methods)、分类识别法(Classification Recognition Methods)是主流。今天基于统计学的机器学习法,其实和那个年代的方法有诸多相似。我们现在同样要训练数据,通过统计学方法用数据建模,然后训练机器智能去建立分类模型。
神经元树突组织的snake模型
上世纪70年代之后,我开始对物理空间感兴趣,也就是用可变形模型来进行影像分析。如今这些早期模型都已经与机器学习整合,我们现在研究中获取的新模型,就是“新”与“旧”的综合。
上观新闻:那么,与上世纪80年代您发现”Snake模型”的过程相比,如今深度学习等技术是否已经改变了科学家探索世界、获取新发现的方式?
特佐普罗斯:人工智能的确改变了当今科学家展开发明发现的方式,尤其人工智能目前在科学领域的运用非常广泛,比如科学家们常借助AI技术发现新药、做基因序列分析、天文学成像等,运用人工智能完成影像分析更是常见。
没错,AI可以运用、结合到很多领域,科学和工程学领域是目前应用最多的。当然,过去的很多“老”办法至今仍然实用,尤其是我刚才说的新老办法结合,这令今天的科学家们同样感到振奋,也是未来机器学习取得更好效果的主要趋势。
(三)中国企业逐渐找到细分市场
特佐普罗斯目前担任UCLA计算机视觉与图形学实验室主任。2016年,他与自己的中国学生丁晓伟一同创办了医疗人工智能企业体素科技。这家在上海和洛杉矶拥有“双总部”的企业,目前在上海的办公室位于浦江镇,50余名员工大多为技术研发人员。公司主要研究方向为人工智能与胸部CT、眼底彩照、冠脉CTA、皮肤病诊疗结合,提供全病种解决方案。
“全病种”是否意味着“大而全”?这一点引起了记者的兴趣。
上观新闻:从您的观察来看,中国的人工智能医疗影像产业目前发展情况如何?我们已经了解到不少利用眼底成像技术筛查糖尿病等慢性病的企业,您觉得目前各个企业是在一窝蜂地涌向同一风口,还是已经逐渐找到了自己的市场定位?
特佐普罗斯:从我的观察来看,大部分中国企业已经找到了细分市场。哪怕是像体素科技关注的整体诊断,其实也是基于清晰的三条研发线和一条产品线。对皮肤状况的研究就是面向消费端的应用产品,通过手机APP拍摄照片来检测皮肤状况。
有些企业专注于眼底识别,做到了专业和精细。我们的研究则基于不同状况和环境进行分析,比如在放射学领域我们关注的不仅是肺部,而是从整个胸腔的影像呈现来判断肺部整体健康情况。无论是做CT、核磁共振还是照X光,最后都通过整区域检查来完成一个复杂的医学影像分析——这就是我们技术的“细分领域”。
3D捕捉人体运动为《指环王》等影片服务
医学成像数据训练
上观新闻:您最近在医学影像领域的研究重点是什么?近年来人们对医学影像诊断糖尿病、肺癌等疾病愈发熟悉,所以医学影像的发展趋势是更用于常见病,还是更多用于罕见病的筛查?
特佐普罗斯:这个问题其实与数据训练有关。常见病在病理数据中更具有代表性,罕见病的数据则相对少很多,因此数据从数量上就存在不平衡。然而,机器学习所需的数据要确保全面,因此这也是医疗领域获取机器学习数据较困难的一点。
现有趋势是运用监测手段,让机器学习还没有被标记的训练数据。比如使用生成模型(Generative Models)去生成训练数据,这样机器就能从少量的、未被人工标记的数据中,分析整合出已经有训练标记的数据,促使机器学习有更好的表现,产生更强大的医学图像分析算法。
用超声波侦查舌头的运动
(四)让“苏利文”的毛发成真用了20年
在加拿大麦吉尔大学攻读本科期间,一节选修课让特佐普罗斯第一次感知到人工智能的魅力,进而继续攻读硕士学位,并由此找到了自己终其一生的研究方向:计算机视觉与图形。
1984年,特佐普罗斯从麻省理工学院获得了人工智能博士学位。三年后,他在发现弹性可变形模型的过程中,与研究者们首次使用物理建模方法模拟了仿真布料。2001年皮克斯出品的动画电影《怪兽电力公司》中,主人公小女孩阿布身穿的粉红色睡衣、“怪兽”苏利文身上软乎乎的蓝色皮毛,均通过基于可变形模型的计算机模拟生成。
上观新闻:你对可变形模型的研究为你和研究伙伴赢得了一座奥斯卡技术成就奖,这对你来说是个意外吗?你觉得下一个让你因为研究获得“意外之喜”的领域会是什么?
特佐普罗斯:其实上世纪80年代中期,我就开始研究计算机图像。当时我们希望通过这一技术模拟人的动态,所以我们就从模拟人的体态着手,我获得的这座奥斯卡就来源于对《怪兽电力公司》等电影中人物衣服布料的模拟。现在这项技术已经被广泛运用于皮克斯乃至整个好莱坞的制作公司,全世界都在使用基于弹性可变形模型衍生出的各种技术手段。
电影《怪兽电力公司》 来源:豆瓣
所以,对电影产业的贡献和得到的认可并非意外,而是都在我们的计划之中,是一步一个脚印才达到的。从最早的技术发明,到最终被全世界广泛应用,当中差不多经过了20年。所以,一项技术的横空出世到广泛应用,真的需要时间,需要人们的耐心。
同样,我现在研究的人工智能与医疗的结合也需要时间。或许10年内我们就能看到巨大的进步。又或许20年后,会出现我们现在想象不到的发展。
上观新闻:您在自己的求学时代就找到了伴随一生的兴趣点,人工智能。在中国,也有很多年轻学子对学习人工智能感兴趣,有什么想对中国学生说的?
特佐普罗斯:人工智能是一个非常令人兴奋的领域,也是一们涉及面很广的学科,可以实现很多交叉学科的成果,把AI技术运用到不同领域。它很值得学习,因为有很多揭露深层次问题的学习领域正等待未来的年轻学子们去研究和解决。
有一些说法称人工智能是“解决世界所有问题的钥匙”。不错,过去十多年来AI的发展进步了不少,尤其是最近十年,因为深度学习的出现,AI的发展取得了长足进步。但仍有许多充满挑战的问题等待未来的人才们去解决。
(原文标题:《专访“计算机视觉奠基人”:AI改变了科学家发现世界的方式》,文章部分插图在不影响内容整体和观点的前提下,哈希力量收录有删节)