想要借助视频生成模型,推动AGI带来的不止OpenAI一家公司。去年12月,Runway提出要开发通用世界模型(General World Model),用旗下的视频生成Gen-2来模拟整个世界,“我们相信,人工智能的下一个重大进步将来自理解视觉世界及其动态的系统,这就是为什么我们要围绕通用世界模型开始一项新的长期研究工作。”
百万级别Token意味着什么?谷歌AI项目负责人杰夫·迪恩(Jeff Dean)解释说,在Gemini 1.5 Pro百万级别上下文窗口支持能力下,用户可以完成复杂的内容交互,轻松解析整本图书、电影、播客,理解非常长的文档,甚至是数百个文件数十万行的代码库。
大模型的解决方案是准备一个视频格式的“世界知识库”,这个知识库的最小单位是“三维时空碎片”,英文叫做“Spacetime Patches”,形象来说就是“时空马赛克”。每一块马赛克都是活体动画块,物理意义上,既有长宽高这样的体积标准,也有随时间演进而动态变化的形状尺度。
Sora使用Transformer架构,建立在DALL·E 3和GPT模型之上,可以生成长达一分钟的有运动、多机位视频。此次,Sora的世界模型,已经能帮助它还原一辆越野车在山区小路上的行驶情况,在视频中添加逼近真实的倾斜和颠簸感。目前,Sora仅开放给了少部分人进行内测,据称是一些视觉艺术家、设计师和电影制作人。
GPTs相当于个人定制版的ChatGPT。目前,GPTs仅对Plus版本的付费用户开放,普通用户既不能创建自己的GPTs,也无法使用他人的GPTs。目前,OpenAI还没有推出官方的GPT商店——之前给出的时间是11月底。因此,我们没法看到所有公开的GPTs名单。
和更信奉硅谷“有效加速主义”的奥特曼相比,Ilya Sutskever 更强调安全和AI的价值观,在最底层与人对齐......正如一位外国科学家所说,在社会发展中,科学技术的车轮是不可阻挡的,伦理道德只能在车前撒一些四脚钉。
在计算机行业,我们聊平台——应用程序和服务赖以构建的技术。Android、iOS和Windows都是平台。智能体将成为下一个平台......如果你想买一台相机,你可以让你的智能体为你阅读所有的评价,总结它们,做出建议,并在你做出决定后下单。
更值得期待的是,Sam Altman还宣布本月晚些时候,OpenAI将上线GPT Store(应用商店),集合开发者们对外公开发布的各类产品。为了帮助开发者群体优化开发体验,OpenAI还在大会上特别发布了AI开发生产力工具“Assistants API(助理API)”。
一边是Jasper、Deepgram等首批初创企业集体哭穷,另一边却是资本对OpenAI、Anthropic等独角兽企业的追捧。冷热交替中,不免让人产生这样的疑问:这轮AI泡沫又要破裂了吗?
GPT以经验主义方式进行学习,其成功回应了一个悬而未决的语言学问题,即乔姆斯基的先验语法。GPT不需要先验语法,这个事实暗示,语言或许本来就没有先验语法。GPT不需要语言学就学到了语言,非常接近不需要语言学理论的维特根斯坦语言理论。
MosaicML的产品组合包括开源的、商业授权的MPT Foundation系列模型和MosaicML推理和训练服务。其推出的MosaicML Composer开源的深度学习库,提供20种用于计算机视觉和自然语言处理的方法,包括模型、数据集和基准。推出的MosaicML Explorer可以帮助开发人员探索和理解不同的云服务和硬件选项之间的时间、性
怎么具备观察和体验能力呢?那就需要机器算法不但要临摹人类的大脑,更需要临摹人类的身体,毕竟是人体在观察和体验这个世界,而大脑只不过是观察和体验结果的数据处理中枢。