【小哈划重点:像Facebook这样的TTS系统承诺无需专用硬件即可提供高质量的语音。实际上,Facebook表示,其系统的加速速度是基准速度的160倍,使其适合计算受限的设备。】
Facebook今天发布了一种高效的AI文本语音转换(TTS)系统,可以使用常规处理器实时进行托管。
目前,它正在为该公司的智能显示器品牌Portal提供动力,并在Facebook内部为其他应用(例如VR)提供服务。Facebook表示,该系统结合了一种利用语言模型进行策展的新数据收集方法,能够在500毫秒内产生一秒钟的音频,从而能够在六个月内(而不是一年内)创建具有英国口音的语音。
像Facebook这样的TTS系统承诺无需专用硬件即可提供高质量的语音。实际上,Facebook表示,其系统的加速速度是基准速度的160倍,使其适合计算受限的设备。
(译文原标题:《Facebook 的语音合成 AI 可以在 500 毫秒内生成语音》)