哈希力量归集文库路径访问: 首页 > 通用人工智能 > 人工智能产业要闻库

Meta公布全新开源AI语音压缩技术:号称比MP3压缩率高10倍

拾柒 ☉ 文 来源:快科技 2022-11-07 @ 哈希力量

【小哈划重点:值得一提的是,虽然此前也有人尝试用神经网络压缩音频,但Meta是首个将此技术用于48kHz立体声的团队。】

11月6日消息,近日,Meta公布了一项名为“EnCodec”的AI语音压缩技术,该技术号称可以64kbps的速度压缩比MP3格式小10倍的音频,同时还能保证不会损失质量。v7O哈希力量 | 消除一切智能鸿沟

Meta指出,压缩技术对目前互联网十分重要,借助于此用户可以十分容易的发送高画质图片、语音信息等。不过,发送这些多媒体信息需要充足的带宽和存储空间,尤其是在未来的宇宙时代,因此需要效果更好的压缩技术。v7O哈希力量 | 消除一切智能鸿沟

v7O哈希力量 | 消除一切智能鸿沟

据介绍,“EnCodec”AI训练模型涵盖三个部分,分别为编码器、量化器和解码器。v7O哈希力量 | 消除一切智能鸿沟

v7O哈希力量 | 消除一切智能鸿沟

编码器可将原始数据转换为较低影帧速率的格式,再由量化器将数据压缩到目标大小,最后,解码器通过神经网络对这些数据进行解码。v7O哈希力量 | 消除一切智能鸿沟

值得一提的是,虽然此前也有人尝试用神经网络压缩音频,但Meta是首个将此技术用于48kHz立体声的团队。v7O哈希力量 | 消除一切智能鸿沟



收录源追溯链接或暂略


本文收录后固定可引用URL链接
    http://www.haxililiang.com/toutiao/kuaixun/35111.html


☉ 文库同一主题内容智能推荐 ☉
哈希力量 ☉ 人机智能科普文库