我们生成的视频,是大模型不可能100%做的,有部分人工、部分AI。今天大模型,尤其用Transformer这种结构一出来有幻觉和偏差,必然要整合到工作流,需要人工修改,去fine-tuning。你一定要做成AI 100%做不了的东西,这才是中国的机会,100%大模型能做的很快就被颠覆掉,你现在做的都是浪费。
英文叫Agent框架。就是大家突然发现,没有Agent框架,大语言模型几乎不能投入实用,所以今年无论在做to C的业务,在做企业级的应用,大模型一定要结合智能体框架,才能真正让大模型长出手脚,让大模型真正跟你的业务系统,跟整个互联网充分打通。
Sora的认知能力使得自动驾驶可能在2024年获得突破;还有一个是具身智能,就是让通用机器人借助Sora使自己增加了眼睛之后,能通过对世界的观察,更了解如何跟世界去交互,会对人形机器人产业带来巨大的推动;第三个在科学研究方面,Sora应该在科学物理实验、化学实验、数学可视化方面会成为一个有力的工具。
Runway它可能做的范围会更加广一些,比如说3D、语音、agent,各种不同的模型,方式更偏向于有一个新的算法,有新的一些功能。但我们是从视频编辑和视频制作的角度出发。它们推出的很多功能,主要是面向电影制作,或者说电影工作室,更偏于一些专业用户。但我们想做得更加偏普通用户能用的一些工具。
在你的笔记本电脑、个人电脑或工业PC上运行边缘人工智能,这方面的能力实际上比大多数人认为的要好得多。我认为这将推动很多设备的销售,也将推动很多计算机科学的发展。
可以在聊天机器人Bard上体验Gemini,它将在2024年整合到谷歌更多的产品线中。在Gemini发布前夕,我们在谷歌位于美国加利福尼亚州山景城的办公室与皮查伊坐下来讨论了它对谷歌、其产品、人工智能和整个社会意味着什么。
人工智能本来就是一个综合性学科,如果研究的成果不能很快被应用,它的价值很可能被遗忘......在大模型时代里,产学研用这件事被极度压缩,表现为周期变短、距离变近。原来像神经网络、CV等技术从被学界研究出来,到真正落地工业产生实际价值,中间要2-5年。
阿尔特曼在信中对米拉、格雷格、布雷特等32个人进行了一一点名感谢,言语富有感情地肯定了他们在OpenAI的工作及一系列变动中的表现。
王坚表示,云计算跟奥运会的关系不是简单的用技术还是不用技术的关系,它的意义就像当年在芝加哥的世界博览会上第一次用交流电。
几个人聊起了马斯克的卫星,当时我们就在心里算卫星轨道。后来在登雪山时,我们晚上没事就继续讨论这个问题,我当时很快就现场推导出了卫星绕地球的高度等数据,我特别震惊,在这么缺氧的情况下脑子还能转这么快,就很有成就感,当时就想下山后要不开个课。
在20世纪70年代和80年代进行人工神经网络研究是完全合理的。这个阶段的发展是无法预见的,直到最近,我还认为这场危机还远未来临。所以,我并不真的为自己所做的事情感到后悔。
即使有计算器,让小孩学四则运算也是有意义的。学习这些基础知识能帮助孩子们理解运算规则,还有个原因是我们有时候手头上不一定有计算器。但我觉得最重要的是,学好四则运算能让人更加相信计算器得出来的结果。学习编程也是这个道理。