【小哈划重点:许多业内人士都在猜测Sora使用了哪些训练数据,以实现如此高的生成质量。在本次采访中,当被问到类似问题时,穆拉蒂回避了直接作答,只表示公司“使用了公开可用的数据和获得许可的数据”。】
在Sora的团队成员称其“不会很快发布”后,AI(人工智能)新锐巨头OpenAI的高层却表示,Sora将在年内正式面市。
当地时间3月13日,OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在接受外媒采访时表示,公司旗下的文生视频模型Sora计划在“今年晚些时候”正式面向公众发布,具体时间“可能在几个月后”。
今年2月,OpenAI放出了Sora生成视频的展示片段,凭借超过一分钟的生成视频时长和逼真的视频质量引起了轰动。不过,OpenAI尚未宣布Sora对公众正式开放的日期,目前也只向安全团队、一些视觉艺术家、设计师和电影制作人开放了Sora的使用权限。
当时,许多业内人士都在猜测Sora使用了哪些训练数据,以实现如此高的生成质量。在本次采访中,当被问到类似问题时,穆拉蒂回避了直接作答,只表示公司“使用了公开可用的数据和获得许可的数据”,并对记者的追问补充称,自己不知道这些数据是否包括来自YouTube、Instagram和Facebook的视频。
穆拉蒂坦言,目前OpenAI生成的视频中仍存在不少缺陷,例如难以表现人类手部的精细动作。而在修复这些问题后,Sora生成视频的底部会出现一个水印,并在文件的元数据中标识它们的来源,以帮助观众分辨真伪。
此外,OpenAI会对Sora进行“红队测试”,即让安全测试人员尝试向其提供提示,以发现漏洞、偏见和其他潜在的有害结果:“实际上,这就是为什么我们现在还没有开放这些系统。我们需要在展开广泛部署之前解决这些问题。”
穆拉蒂还表示,Sora的提示词使用规则会与文生图模型Dall-E的规则相近。例如,Sora不能为用户生成包含公众人物的图像,会直接拒绝这类请求。穆拉蒂还提到,针对裸露问题,公司正在与艺术家展开合作,试图找出“在不妨碍创造力的前提下设置保护栏与限制”的方法。
对于Sora与Dall-E的联系,穆拉蒂还谈到,为Sora提供能源的成本“要高得多”。OpenAI试图在向公众发布这个工具时,让其成本能够做到“与DALL-E相近”。
而当记者问到Sora对视频制作工作的影响时,穆拉蒂再次强调,Sora的推出过程“缓慢而谨慎”,并表示OpenAI已经让影视行业内的工作人员加入测试:“我们希望电影行业的从事者和全球各地的创作者都能参与其中,并告知我们如何进一步地发展它。”
值得注意的是,就在几天前,Sora团队的三位负责人刚公开表示Sora不会在“可预见的未来”发布。他们在3月8日发布的一档Youtube播客节目中表示,Sora仍是一个研究项目,无法在ChatGPT或其他地方提供给用户:“对于应该什么时候把它变成产品,我们目前都没有一个时间表,我们正处于获取反馈的阶段。我们肯定会改进它,但应该如何改进它还是一个悬而未决的问题。”
责任编辑:王杰,校对:张亮亮