哈希力量归集文库路径访问：首页 > AI业界 > 企业特写/新闻稿/推广稿/信件

新闻文章变短视频百度研究院公测智能视频合成平台VidPress

林迪 ☉ 文来源：环球网科技 2020-04-21 @ 哈希力量

【小哈划重点：据介绍，AI新闻视频仍在探索更多的可能性，例如针对不同垂直分类或投放渠道的定制合成、针对用户特点定制化视频生成以满足个性化需求等等。】

4月20日消息，百度研究院宣布已孵化出业界首个支撑通用型、大规模生产的智能视频合成平台VidPress。

据悉，用户一键输入新闻图文内容链接后，其余全部工作由平台自动化完成，视频素材智能化聚合、解说词生成、语音合成、音视频对齐和渲染导出整套制作流程在9分钟以内实现。

其实，智能视频合成平台VidPress已在各视频平台得到了实际验证，百度研发了分布式视频生成系统和对外服务的REST API，为好看视频大规模生产提供服务。

根据好看视频使用数据, 目前生成一个时长2分钟左右的720p视频, 所需时长的中位数仅为2.5分钟；平台每天可以生产500到1000条视频，整个过程从热点发现到最终的视频生成完全无人化、自动化；此外，VidPress所生成的视频播放完成率比好看视频的大盘高出15个百分点，一些热门视频已经有了85万的播放量。

具体来讲，用户输入图文内容后, 例如输入某条新闻事件的链接，平台将基于NLP模型进行语义理解，并通过主体模型聚合相关新闻素材，以及从同一主题相关新闻里抽取更多的素材及其语义表征，充分保障素材内容的丰富度和相关性。

紧接着，解说词语音生成和素材深度挖掘同步启动：一方面，平台基于多种语言模型对原文进行处理，自动生成一篇字数符合要求且适合视频呈现的解说词，并通过百度文字转音频服务（TTS）合成解说词语音，效果媲美播音员。

与此同时, 平台会根据对原文的理解, 通过自有视频库和百度搜索引擎搜索，智能化聚合最新最适合呈现的内容，并基于人脸识别、物体识别、视频内容理解等计算机视觉服务进一步解析和理解，自动剪切和精选视频素材。

上述两个步骤完成后，平台将基于解说词音轨时间轴和所聚合的媒体片段，进入音视频对齐剪辑过程。百度升级后的第二代时间轴对齐算法，其关键在于选取出文本中的兴趣点, 再将媒体片段与兴趣点进行相关度打分，将优质媒体片段优先放入时间轴，以此保证视频的整体观感和用户兴趣的持续激发。

据介绍，AI新闻视频仍在探索更多的可能性，例如针对不同垂直分类或投放渠道的定制合成、针对用户特点定制化视频生成以满足个性化需求等等。同时，百度并不满足于提供内容生产平台，还希望依托自身丰富的数据资源，对某一个热门新闻进行多角度观察和报道，让受众能够更客观的了解一个事件，在推动互联网内容的信息中立化中发挥更大作用。

目前，VidPress平台已经开放了申请试用。

附VidPress“剪片子”具体步骤：

1、申请测试后进入“VidPress”页面，点击“Create first video”跳转页面。

2、复制想要进行视频转换的新闻内容链接，并粘贴至VidPress，选择旁白音色、视频时长、清晰度后，点击生成。

3、检查旁白及字幕，根据需要编辑文案，一键修改，剪完收工！

哈希力量附试用申请链接：

https://ai.baidu.com/creation/external/labprojectlist

（原文标题：《百度研究院宣布孵化出首个智能视频合成平台VidPress》）