【小哈划重点:我最近很感兴趣的一个项目是制造视觉检测,看着从生产线上下来的智能手机的图片,你能看出图片有没有缺陷呢?或者能看出汽车部件上有没有凹痕呢?】
吴恩达一生中有很多头衔,你也许知道他是谷歌大脑团队的创始人,或者是百度的前首席科学家。你也许是上过他的课,通过广受欢迎的在线课程,他向无数学生、好奇的听众和商业领袖传授了机器学习的原理。
(来源:MIT Technology Review)
目前,他在2017年创立的最新创业项目Landing AI中,探索没有庞大数据集可供利用的企业如何加入AI革命。
3月23日,吴恩达在《麻省理工技术评论》的虚拟EmTech Digital峰会上分享了他的经验教训。
《麻省理工技术评论》:我敢肯定人们经常问你:“怎么建立一个以AI为先的企业呢?”你通常会怎么回答呢?
吴恩达:我通常会说:“不要那样做”。如果我在带一个团队,就会说:“嘿,大家请以人工智能为先” ,团队就会把重点放在技术上,这也许对一个研究实验室来说挺好的。但做生意时,我一般是以客户或任务为导向,几乎没有以技术为导向过。
《麻省理工技术评论》:你建立了这个叫作Landing AI的新创业项目。你能告诉我们这个项目是什么吗?以及你为什么选择做这个项目?
吴恩达:在谷歌和百度带过AI团队后,我意识到AI已经改变了消费类软件互联网,比如网络搜索和在线广告,但我想把AI运用到其他所有行业,这在经济中占更大比重。
所以在研究了很多不同行业之后,我决定从制造业下手。我觉得很多行业已经具备了创建AI的条件,但一个行业创建AI条件更成熟的一个模式就是它正在经历数字转型,这样就会有一些数据,这为AI团队利用数据创造价值提供了机会。
我最近很感兴趣的一个项目是制造视觉检测,看着从生产线上下来的智能手机的图片,你能看出图片有没有缺陷呢?或者能看出汽车部件上有没有凹痕呢?
一个巨大的区别是在消费类软件互联网上,也许你有10亿用户和大量的数据。但在制造业,没有一家工厂生产过10亿部甚至100万部刮花的智能手机。所以挑战是你能用AI处理100张图像吗?
事实证明,你可以做到,用少量的数据就可以做这么多事情,我每次都惊叹不已。所以,尽管所有围绕AI的宣传、热度和公关都是以巨大的数据集为卖点,但我觉得我们也还有很大的发展空间来开创其他挑战大不相同的应用程序。
《麻省理工技术评论》:你是怎么运营这个项目的?
吴恩达:我看到首席执行官和首席信息官经常犯的一个错误是,他们对我说:“嘿,安德鲁,我们没有那么多数据,我的数据一团糟。所以给我两年时间来建立一个完善的 IT 基础设施,这样我们就有了构建AI所需的海量数据。”我总回答道:“这是错的。别这么做。”
首先,我认为当今世界上没有一家公司,甚至是科技巨头会觉得他们的数据是完美无瑕的,这是一个过程。而花2-3年时间构建一个漂亮的数据基础设施,意味着你没有AI团队的反馈,来帮助你优先考虑要构建什么样的IT基础设施。
例如,如果你有很多用户,你是否应该优先给他们做调查问卷来获得更多数据?或者在工厂里,你是否应该优先升级传感器,从记录每秒10次震动到每秒100次震动?通常情况下,在开始AI项目时,你掌握的数据能够让AI团队给你提供反馈,帮助你优先考虑还要收集哪些数据。
在不具备消费类软件互联网规模的行业,我觉得我们需要从大数据转向优质数据。如果你有一百万张图片,那就用吧。但使用小得多、标签清晰、精心整理的数据集就会出现很多问题。
《麻省理工技术评论》:你能举个例子吗?你说的优质数据是什么意思?
吴恩达:我先举一个语音识别的例子,我在使用语音搜索时,会听到有人说,“嗯,今天的天气”的音频片段,问题是这个音频片段该怎么正确转录呢?是“嗯,今天的天气”,还是“嗯、、、今天的天气”呢?抑或是“嗯”这个词我们没抄下来?
其实这三种都可以,但不同的转录器用这三种标记方式就有问题了,这样数据就会有噪音,损害语音识别系统。现在,你有数百万或10亿用户时,就可以把那些噪音数据平均分配一下——学习算法就可以很好做到这一点。但如果你的数据集比较小的话,如100个例子,那这类噪音数据会让效果大打折扣。
还有一个是制造业的例子:我们在钢材检验方面做了很多工作。如果你开一辆侧面曾经是用钢板做的车,有时钢板上会有一些小褶皱、小凹痕或斑点,你就可以用相机和计算机视觉来检查是否有缺陷。
但不同的贴标人员会对数据进行不同的标记,有些人会在整个区域周围放一个巨大的限位框,有些人会在小粒子周围设置小小的限位框。当你的数据集很小时,确保不同的质检人员统一标记数据是最重要的事情之一。
对很多AI项目来说,你从GitHub上下载的开源模型——你可以从文献中获得的神经网络——(这)已经够好了,(虽然)这不能解决所有问题,但可以解决主要问题。所以我跟我团队很多人说,“嘿,大家,神经网络已经够好了。我们不要再搅乱代码了。你们现在唯一要做的就是建立流程来提高数据质量。”事实证明,这通常能让算法的性能提高得更快。
《麻省理工技术评论》:你提到较小的数据集时,是指多大的数据?一百个例子?还是十个例子?
吴恩达:机器学习太多样化了,很难给出一刀切的答案。我曾经处理过有2亿到3亿张图片的问题,也处理过只有10张图片的问题,以及介于这两者之间的我也都处理过。我观察制造业应用程序时,我认为一个缺陷类有几十或上百个图像是很正常的,但即使在工厂内部也有很大的差异。
我确实发现,训练集的规模低于比如说10000个例子时,AI实践就会切换,因为这是一个阈值,工程师基本可以查看每个例子,自己设计、然后做出决定。
最近,我和一位非常出色、在一家大型科技公司工作的工程师聊天。我问他:“嘿,如果标签不一致的话你会怎么办?”他回答道:“嗯,我们在海外有几百人的团队做标签,所以我会写下标签说明,让三个人给每张图片贴上标签,然后我取一个平均值。”我说:“是的,数据集很大时就得这么做。”但我和一个较小的团队合作时,如果标签不一致,我就会找到这两个意见不一致的人,让他们打一个Zoom视频电话,互相交谈一下,试图达成一个解决方案。
《麻省理工技术评论》:现在我想请你谈谈对一般AI产业的看法。我收集了我们读者想问你的问题。一位读者问道:AI的发展似乎主要分两种方向,一种是学术研究,一种是大规模、资源密集型的大公司项目,如Open AI和Deep Mind。这并没有给小型创业公司留下太多的空间。你认为小公司可以关注哪些实际问题来推动AI的真正商业应用呢?
吴恩达:我认为很多媒体都把注意力放在大公司上,有时也放在大型学术机构上。但如果你参加学术会议,就会发现很多工作是由小型研究小组和研究实验室完成的。我和不同公司各行各业的人士交谈时,我觉得他们可以利用AI来解决很多商业应用问题。我通常去问商业领袖:“你们最大的商业问题是什么?你最担心的事情是什么?”这样我就能更好理解企业的目标,然后集思广益是否有AI解决方案,有时找不到解决方案的话,那也没关系。
也许我要提几个我觉得兴奋的差异,我认为今天构建AI系统仍然需要大量的手工操作。你有一些聪明的机器学习工程师和数据科学家在计算机上做事情,然后把事情推向生产,在这个过程中有很多手动步骤。因此,我对ML Ops(机器学习操作)感到兴奋,因为这是一门新兴学科,有助于让构建和部署AI系统的过程更加系统化。
此外,如果你看看许多典型的商业问题(从营销到人才)的所有职能,就会发现自动化和效率提高的空间很大。
我也希望AI社区能够关注最大的社会问题,看看我们能为气候变化、无家可归或贫困做些什么。除了有时非常有价值的商业问题,我们也应该致力于最大的社会问题。
《麻省理工技术评论》:你如何确定是否有机会在你的企业中进行机器学习呢?
吴恩达:我会试着自己学习一些商业知识,也会试着帮助商业领袖学习一些有关AI的知识,然后我们通常会集思广益一组项目,对于每个想法,我会同时在技术和业务上作出努力。我们将着眼于:你是否有足够的数据?精度是多少?您将其部署到生产环境中时,是否存在长尾现象?你如何填充数据,为持续学习形成闭合回路?所以要确保问题在技术上是可行的。然后是商业方面做出的努力:我们要确保这会实现我们期待的投资回报率。在这个过程之后,你通常要做这样的事情,比如评估资源、里程碑。
另一个建议是:开始要快,这很重要,从小处开始也没关系。我在谷歌第一个有意义的商业应用程序是语音识别,而不是网络搜索或广告,但帮助谷歌语音团队提高语音识别的准确度,给大脑团队确立了信誉以及提供必要的资金去追求更大的合作伙伴。
所以谷歌地图是我们第二大合作伙伴,我们使用计算机视觉,读取房屋号码,在谷歌地图上定位房屋。只有在前两个项目成功之后,我才与广告团队好好探讨了一下。我想我看到过很多公司因为起步太大而失败,这比起步太小而失败的要多。作为一个组织,你可以先做一个较小的项目,了解一下使用AI的感觉,然后再继续做大。
《麻省理工技术评论》:为了在自己的公司里实现AI,我们的用户明天应该开始做一件什么事?
吴恩达:投入。AI正在改变许多行业的格局,所以,如果你的公司还没有做出非常浩大和明智的投资,这是一个好时机。
责编:多加
参考:https://www.technologyreview.com/2021/03/26/1021258/ai-pioneer-andrew-ng-machine-learning-business/
(文章原标题:《吴恩达:不要建立AI先行的企业,而要从任务导向开始 | 专访》)