它接受了大量不一致的数据训练,试图预测下一个网络用户会说什么。人们对很多事情有不同的观点,而它必须有一种混合所有这些观点的方式,以便可以模拟任何人可能说的话。这与一个试图拥有一致世界观的人非常不同,特别是如果你想在世界上采取行动,拥有一致的世界观是非常有益的。
RLHF技术背后的其中一个作者正是John Schulman。很多人不知道的是,他也是ChatGPT项目的主要负责人。在ChatGPT发布前一个月,John Schulman在Robin Ranjit Singh Chauhan主持的TalkRL播客节目中,详细介绍了RLHF想法的产生源头,InstructGPT以WebGPT的主要思想,并阐述了AI对齐以及对AGI实现的看法。
开源的话在价格上有非常明显的优势,基本上可以不要钱就能使用这些东西;闭源如果还有生存空间的话,一定是做得比开源好,才有生存空间。所以当你更加追求效果的时候,你就会选择一个闭源的模型。但这是一个静态的观察或者说是讨论,动态的话可能说随着时间的推移,开源和闭源两条技术路线,最后谁会跑得更快。
在我年轻时代,69岁的美国人乔治·海尔迈耶发明了液晶,人们那时描绘将来做一面墙都是图像。我们那时连电视机都还没有看见过,怎么能理解未来,你想想这个科学的预测有多厉害!现在连液晶墙面也已经没落了。
许多实验室和公司正在开发类似的技术,将文本转化为图像。谷歌有Imagen,OpenAI有DALL-E,还有一些较小的项目,如Craiyon。这种技术从何而来,你觉得它未来会走向何处?Midjourney的愿景与这个领域的其他人有什么不同?
去年秋天,山姆·阿尔特曼与Open AI创始人之一、领英联合创始人雷德・霍夫曼(Reid Hoffman)展开了一场精彩对话。其中,山姆·阿尔特曼分享了他对于未来AI发展的预测:AI大模型技术,将成为继移动互联网之后,未来最大的技术平台;而以聊天机器人为界面,加上图像、音乐、文本等多模态模型的发展,将诞生大型企业。
将神经网络与人脑类比是值得商榷的。诚然,神经网络的起源受到了人脑的启发,但如今通过训练得到的人工智能的优化过程和人脑的优化过程有很大区别。人脑通过长时间的多智能体的自博弈(self-play)过程不断演化,大脑中的预测模型对于人类的存活和繁衍至关重要。而神经网络的优化实际上是对于大量数据的压缩。
罗恩:我的问题一直是,如果我们拥有自动驾驶,我们拥有自动驾驶的卡车,想法之一是不是可以用我们自己的卡车运送车辆。如果没有足够的司机,我们还可以开展自动驾驶运输。埃隆:如果你就在这个地区,我们会让汽车直接开到你身边。
我认为游戏是一种独特的媒介,作为玩家并不仅仅是被动地消费娱乐,实际上,你是作为一个代表积极参与的。所以我认为这就是游戏在某些方面比其他媒介,例如电影和书籍等更有内涵的原因。从一开始我们就对AI进行了深入的思考,将游戏作为证明和开放AI算法的试验场。
为什么就不是人形的?因为人本身很多任务也干不了。像清洗通风管道,需要蛇形机器人在管道里爬。人在完成很多任务的时候也需要借助工具......当所有人做我们想做的事,必然世界上有必须做、大家不愿意做的。比如居家生活两口子谁做饭、谁洗碗。机器人就是我们可以欺负欺负的另一个物种。
过去的制造业的技术投入是在设备上的投入,流水线上的投入;现在是在数字化流程的改造、数字技术和人才的投入,是在产品的数字化改造上进行投入。
AI的优势在于,不需要设计师进行场景的三维重建,这是一项较为劳动力密集的工作。我们用普通的民用摄像头产品,甚至手机围绕现场走一圈就可以把场景快速地建立出来。而且这些部署的摄像头,可以实现三维高清定位,快速地标定至三维的空间位置中,这样不管厂区还是园区的数字化管理就会非常高效地进行。