【小哈划重点:抖音算法已几乎不依赖对内容和用户打标签,而是通过神经网络计算,预估用户行为,计算用户观看这条内容获得的价值总和,把排名靠前的内容推给用户。抖音应用的深度学习算法包括Wide&Deep模型、双塔召回模型等。】
4月15日,抖音安全与信任中心开放日在北京举办。
此前,抖音安全与信任中心网站已上线试运行。本次开放日,旨在邀请广大网友体验抖音安全与信任中心,了解算法原理、机制和治理政策,共建美好社区。
开放日上,抖音相关业务负责人基于网站版块,就社会关切的算法和治理问题展开介绍。据现场分享,推荐算法作为人工智能机器学习技术的重要应用场景,本质上是一套高效的信息过滤系统。在抖音的实际应用中,推荐系统采取“人工+机器”协同的方式进行风险治理,始终有人工运营和治理体系为算法导航;多目标体系算法能主动打破 “信息茧房”,为用户带来更丰富多元、实用可靠的推荐结果。
目前,抖音安全与信任中心正广泛向用户、创作者、社会各界征集意见,前往95152.douyin.com即可访问。如果你对有任何建议和疑问,欢迎反馈给抖音官方服务热线95152和邮箱feedback@douyin.com。这将帮助我们,一同为用户创造安全和可信任的平台环境,打造开放、积极、多元、友善的平台。
以下为抖音安全与信任中心“走近算法”版块介绍,详细内容可访问:
https://95152.douyin.com/transparency
01
从零开始了解推荐系统
推荐平台依靠算法,能智能主动地发掘用户兴趣,帮助解决超大规模信息分发的效率问题。
推荐算法核心目标是通过分析用户的“行为”(点击、浏览、喜欢、转发、收藏等),构建个性化的推荐模型。系统会基于用户历史动作、对象特征和上下文环境,采用算法模型,预测用户可能会对什么样的内容产生什么样的行为。
抖音算法已几乎不依赖对内容和用户打标签,而是通过神经网络计算,预估用户行为,计算用户观看这条内容获得的价值总和,把排名靠前的内容推给用户。
抖音应用的深度学习算法包括Wide&Deep模型、双塔召回模型等。前者可解决协同过滤算法容易造成信息单一、泛化不足的问题;后者在召回环节提供更好的推荐效果。
更多了解抖音推荐系统详情,可访问:
https://95152.douyin.com/article/15358?enter_from=channel_page&channel=transparency
02
用户行为背后的算法推荐逻辑
基于人工智能机器学习和深度学习构建的推荐算法,其本质是数学模型的运算过程,只是在建立用户行为与内容特征之间的数学统计关联,而非理解内容本身。抖音推荐算法的核心逻辑可以简化为“推荐优先级公式”:综合预测用户行为概率 × 行为价值权重 = 视频推荐优先级。
模型需要内容和用户两端的数据做输入,其中主要是学习用户行为数据。结合用户行为和视频本身的价值权重,推算出视频推荐的价值分数,并将综合得出的价值最高的视频推送给用户。
抖音的价值模型希望实现内容、用户、作者以及平台的多方价值共赢,并通过不断调整参数,对各类价值进行加权。随着算法的进步,抖音已经实现了“分钟级”实时反馈更新。
更多了解算法如何预估用户行为,可访问:
https://95152.douyin.com/article/15381?enter_from=channel_page&channel=transparency
03
抖音算法的多目标平衡
推荐算法通过各种“目标”来预估用户行为。推荐算法诞生之初,只关注单一或者少量的目标。早期的抖音以15秒短视频为主,这一阶段,完播率是推荐算法的核心目标之一。
随着抖音的用户愈发多样化,内容风格也日益多元,平台上有了越来越多的优质中长视频,完播率等少数目标难以满足需求,多目标建模成为技术上的自然选择。
抖音已经发展出非常复杂的多目标体系,比如将收藏率纳入多目标,帮助知识类内容推送给有需求的用户;增强“收藏+复访”“关注+追更”“打开+搜索”等组合目标,预估用户长期行为,帮助用户探索长期需求;设置探索类指标,帮助用户探索可能他们自己都还没发现的潜在需求,助力破除“信息茧房”;设置原创性目标,鼓励优质、新颖且具有独特价值的内容推荐。
更多了解抖音算法设置了哪些多目标,可访问:
https://95152.douyin.com/article/15383?enter_from=channel_page&channel=transparency
04
平台治理为推荐算法设置“护栏”
算法无法理解内容语义,因其对内容的理解存在不足,可能导致违法违规、不良内容被推荐传播。在真实使用场景中,算法必须要由平台治理对其进行约束和规范。
平台治理存在于内容发布与传播的每一个环节,整体遵循两个原则。一是所有在平台发布的内容都会经过评估,流量越高的内容经过评估的次数越多,标准也越严格;二是“人工+机器”审核相互分工又密切配合。
一条视频可能触发多个治理研判节点,视频被举报、评论区出现集中质疑、流量激增等情况,均可能触发“人工+机器”审核。而在任一环节,一旦内容被处置,基本都会立即停止进一步的推荐和分发。
针对社会普遍关心的、呈现聚集特征的、反复出现的、对用户造成较多困扰的焦点问题,抖音成立了数个专项治理团队,分别设置相应的治理标准、识别策略、处置手段和风险巡查能力,专注应对涉及特殊群体、网络暴力、AIGC技术滥用等问题治理。
更多了解抖音如何做专项治理,可访问:
https://95152.douyin.com/article/15384?enter_from=channel_page&channel=transparency
此外,对于公众关心的“信息茧房”等议题,抖音安全与信任中心均有回应,针对大家关心的问题我们将持续更新。欢迎前往中心官网95152.douyin.com访问,了解更多详情。
(原标题:《一文全解!抖音算法原理公开》)
https://mp.weixin.qq.com/s/shicMaTxnkY1lK3NKKalwQ