哈希力量归集文库路径访问: 首页 > 通用人工智能 > 人工智能产业要闻库

Snap团队最新AI研究成果:2秒文字成图 手机上运行

佚名 ☉ 文 来源:PingWest品玩 2023-06-02 @ 哈希力量

【小哈划重点:与传统的文生图模型相比,SnapFusion的生成速度快且质量高,同时避免了高端GPU和云推理这些成本高昂的方式,也规避了可能出现的隐私问题。】

6月2日讯,据arxiv上的一篇论文显示,一款名为SnapFusion的图片生成模型现已进入测试阶段。据悉,该模型开发团队的大部分人员均来自snap。mXZ哈希力量 | 消除一切智能鸿沟

SnapFusion可以在移动设备上使用,能在不到2秒的时间内生成一张512x512的高质量图片。与传统的文生图模型相比,SnapFusion的生成速度快且质量高,同时避免了高端GPU和云推理这些成本高昂的方式,也规避了可能出现的隐私问题。mXZ哈希力量 | 消除一切智能鸿沟

通常来说,文生图模型难以在移动设备上使用,因为这种模型都具有复杂的网络价格和数十个去噪迭代,运行时需要大量的计算资源,因此需要高性能GPU来帮助计算。但大部分移动设备都不具备这样的资源。所以当前市场上可以运行在移动设备上的图片生成模型都存在运行时间长,算力需求大等缺点。mXZ哈希力量 | 消除一切智能鸿沟

SnapFusion的研究目的就是改善这一现象。SnapFusion采用了高效的UNet框架来训练,通过识别原始模型中的冗余并使用数据蒸馏技术减少图像解码器的计算量。与经典的图片生成模型Stable Diffusion v1.5相比,SnapFusion在性能和速度方面均表现出色。mXZ哈希力量 | 消除一切智能鸿沟

同时,SnapFusion还采用了一种名为data distillation pipeline的技术来加速和压缩图像解码器,从而进一步提高了推理速度。SnapFusion还采用了step distillation技术来减少迭代去噪的步骤,从而实现了更快的推理速度。SnapFusion还通过使用不同的训练管道和学习目标来改善图像质量。mXZ哈希力量 | 消除一切智能鸿沟

目前SnapFusion已经进入实测环节。根据测试画面显示,SnapFusion可以在极快的时间内按照文本要求生成不同的图片。用户可以根据自己的需求来改善图片内的内容,并且拥有不同的风格可供选择。目前SnapFusion还没有正式发布,具体发布日期尚未公布。mXZ哈希力量 | 消除一切智能鸿沟

手机上实现文生图-测试-哈希力量mXZ哈希力量 | 消除一切智能鸿沟



收录源追溯链接或暂略


本文收录后固定可引用URL链接
    http://www.haxililiang.com/toutiao/kuaixun/35798.html


☉ 文库同一主题内容智能推荐 ☉
哈希力量 ☉ 人机智能科普文库