创泽机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > 机器人知识 > 微信提出推荐中的深度反馈网络,在“看一看”数据集上达到SOTA

微信提出推荐中的深度反馈网络,在“看一看”数据集上达到SOTA

来源:AI科技大本营     编辑:创泽   时间:2020/5/22   主题:其他 [加盟]

在推荐系统中,用户的显式反馈、隐式反馈、正反馈和负反馈都能够反映用户对于被推荐物品的偏好。这些反馈信息在推荐系统中十分有用。然而,现在的大规模深度推荐模型往往以点击为目标,只看重以用户点击行为为代表的隐式正反馈,而忽略了其它有效的用户反馈信息。

作者在本文中关注用户多种显式/隐式和正/负反馈信息,学习用户的无偏兴趣偏好。具体地,作者提出了一个Deep Feedback Network (DFN)模型,综合使用了用户的隐式正反馈(点击行为)、隐式负反馈(曝光但未点击的行为)以及显式负反馈(点击不感兴趣按钮行为)等信息。

DFN模型使用了internal feedback interaction component抓住用户行为序列中的细粒度的行为级别的交互,然后通过external feedback interaction component,使用精确但稀少的隐式正反馈和显式负反馈作为监督,从噪音较多的隐式负反馈中进一步抽取用户的正负反馈信息。在实验中,作者基于微信看一看的数据,进行了丰富的离线和在线实验,模型与baseline相比均取得显著提升。


1、模型背景与简介

推荐系统在日常生活中被广泛使用,为用户获取信息与娱乐提供便利。推荐系统算法往往基于用户与系统的交互,这些交互行为可以大致分为以下两类:显式反馈与隐式反馈。显式反馈从用户对于物品的直接态度中获取,例如评论中的一星到五星,或者微信看一看系统中的“不感兴趣”按钮。这类反馈能够直接表达用户的正向以及负向偏好,但是这类反馈的数量往往不多。隐式反馈从用户的行为中间接获得,例如用户的点击/不点击行为。这些信息在推荐系统中往往是海量的,但是这些信息有着较多噪声(用户点击的并不一定是他真正喜欢的)。另外,隐式反馈通常是以正反馈的形式出现,推荐中的隐式负反馈存在巨大噪声(未展现信息或者未点击信息并不一定意味着用户不喜欢这些内容)。

在近期的深度推荐系统中,CTR导向的目标受到极大关注。因此,模型不可避免地只关注和目标紧密相关的用户点击行为,忽略了其它用户行为中蕴含的丰富信息。仅考虑CTR导向目标的推荐模型往往会遇到以下两个问题:(1)CTR导向目标只关注用户喜欢什么,没有关注用户不喜欢什么。这样,模型的推荐结果容易同质化和趋热化,损害用户体验。因此,负反馈信息是必要的。(2)用户除了被动地接受系统推荐的物品,有时也需要能够主动和即时的反馈机制。用户希望能够高效和准确地告知系统自己喜欢或者不喜欢什么。另外,用户的显式和隐式反馈之间也会存在割裂(用户点击的并不一定是他真正喜欢的)。因此,显式反馈也是必要的。显式信息和隐式信息能够作为彼此的补充,相辅相成。已有工作通过使用用户的未点击/未曝光行为作为用户的隐式负反馈,这样会引入极大的噪声。另外一些工作尝试使用用户的显式负反馈信息。这些信息固然精确,但是也往往比较稀疏。

为了解决这些问题,综合使用用户多种显式/隐式和正/负反馈信息学习更好的无偏用户表示,作者提出了一个Deep Feedback Network (DFN)模型。图1中给出了在微信看一看场景中的三种用户反馈。DFN通过internal feedback interaction component抓住用户行为序列中的细粒度行为级别的交互,然后通过external feedback interaction component,使用精确但稀少的隐式正反馈和显式负反馈作为监督,从噪音较多的隐式负反馈中进一步抽取用户的正负反馈信息。这些反馈特征会和其他用户/物品特征混合,并行使用FM、Deep和Wide层进行特征交互,最后进行CTR预估。

作者基于微信看一看推荐系统,设计了离线和线上实验,在多个指标上具有显著提升。这篇工作的主要贡献如下:

1、作者第一次融合隐式正反馈(点击行为)、隐式负反馈(曝光但未点击的行为)、显式负反馈(点击不感兴趣按钮行为)和它们之间的交互信息进行用户行为建模;

2、作者提出了一个全新的Deep Feedback Network (DFN)模型,能够学习到用户无偏的兴趣偏好;

3、模型在离线和在线任务上都得到了显著提升,具有工业级实用价值。论文中也提出了一个feed流中的显式负反馈预测任务。

 

2、模型结构

DFN模型主要分为三个阶段:首先,deep feedback interaction module以用户的多种反馈行为作为输入,输出用户的反馈特征。然后,Feature Interaction Module进一步考虑用户的其它特征和物品特征,使用FM、Deep和Wide层进行特征交互。最后,输出层使用CTR作为训练目标。图2给出了DFN的整体结构。

deep feedback interaction module是模型的主要创新点。它包括了两个组成部分:Internal Feedback Interaction Component和External Feedback Interaction Component。图3给出了deep feedback interaction module的结构。

首先,在Internal Feedback Interaction Component中,用户的隐式正反馈、隐式负反馈和显式负反馈序列和target item一起,通过一个transformer层,得到了在各个序列内部细粒度的item-level的交互信息,然后经过average层得到三种反馈的特征表示,其中隐式正反馈特征中蕴含高质量的用户正向偏好,显式负反馈特征中蕴含高质量的用户负向偏好。

第二步,在External Feedback Interaction Component中,隐式负反馈序列往往是三种行为中最多的行为,但也是噪声最大的行为。作者把高质量的和target item交互后的隐式正反馈特征和显式负反馈特征看作一种高质量指导,从用户未点击序列中挖掘用户或许喜欢/不喜欢的物品,补充用户的正向负向偏好。作者使用了一个attention层得到了两种用户弱正向/负向反馈特征。这两种弱反馈特征和第一步的三种反馈特征拼接后成为最终的用户反馈特征。

第三步,在Feature Interaction Module中,作者使用了FM、Wide和Deep层,对用户其它特征、物品特征和用户反馈特征等进行低阶/高阶特征交互。这一个模块是为了充分利用各种特征辅助推荐,使得模型在真实工业级任务上达到最好的效果。使用Wide层主要是为了给潜在的特征工程留下接口。

最后,作者基于CTR loss进行训练。除去传统的正例和未点击负例,作者还增加了一项预测用户负反馈点击的loss。由于在实际推荐系统中,用户给出主动显式负反馈的次数极少,显式负反馈中的负向信息也极其强烈,所以作者单独在loss中强调了这一项,并且给予了较大的训练权值。

3、实验结果

离线和线上实验均在微信看一看上进行,离线数据集包含千万级用户在百万级物品上的亿级行为。模型离线CTR预估结果如图4:

4、总结

在本文中,作者初步研究了推荐系统中的多种显式/隐式和正/负反馈之间的协同合作机制。DFN模型能够基于多种反馈信息即时学习到用户的无偏的正负向兴趣,在点击预估和不感兴趣预估等多个任务上均有提升效果。直观而有效的模型也使得DFN能成功在工业级推荐系统中得到部署和验证。我们预测用户的显式反馈,特别是显式负反馈的信息将会未来推荐系统中起到更加重要的作用,在发掘推荐系统可解释性同时提升用户体验。





“触控一体化”的新型机械手指尖研究

机械手面临的难点在于如何在柔性物体上施加可控的挤压力,以及在非稳定状况下确保精确、稳健的抓握与柔性指端操控

戴琼海院士:搭建脑科学与人工智能的桥梁

脑科学的发展将推动人工智能科学从感知人工智能到认知人工智能的跨越

如何加快解决数据产权问题

数据所有权方面,1原始数据属于个人,2企业享有衍生数据所有权,3政府享有政府数据的归属权

图像检索入门、特征和案例

图像检索是计算机视觉中基础的应用,可分为文字搜图和以图搜图。借助于卷积神经网络CNN强大的建模能力,图像检索的精度越发提高

《视觉SLAM十四讲》作者高翔:非结构化道路激光SLAM中的挑战

SLAM阶段:解决从原始传感器数据开始,构建某种基础地图的过程,标注阶段:在SLAM结果基础上进行人为标注,实现更精细的交通规则控制

SLAM与V-SLAM特征对比

基于激 光雷达的SLAM(激光SLAM)和基于视觉的SLAM(V-SLAM)。激光SLAM目前发展比较成熟、应用广泛,未来多传感器融合的SLAM 技术将逐渐成为技术趋势,取长补短,更好地实现定位导航。

国内外舵机参数性能价格比较

舵机是步态服务机器人的核心零部件和成本构成,是包含电机、传感器、控制器、减速器等单元的机电一体化元器件

AI在COVID-19诊断成像中的应用

人工智能技术支持的图像采集可以显著帮助扫描过程实现自动化,还可以重塑工作流程,最大限度地减少与患者的接触,为成像技术人员提供最佳保护

不完美场景下的神经网络训练方法

腾讯优图实验室高级研究员Louis在分享了自适应缺陷数据,业务场景下的神经网络训练方法

深度学习的可解释性研究(一)— 让模型具备说人话的能力

为决策树模型是一个具有比较好的可解释性的模型,以决策树为代表的规则模型在可解释性研究方面起到了非常关键的作用

深度学习的可解释性研究(二)——不如打开箱子看一看

神经网络模型本身其实并不是一个黑箱,其黑箱性在于我们没办法用人类可以理解的方式理解模型的具体含义和行为

深度学习的可解释性研究(三)——是谁在撩动琴弦

神经网络的敏感性分析方法可以分为变量敏感性分析、样本敏感性分析两种,变量敏感性分析用来检验输入属性变量对模型的影响程度,样本敏感性分析用来研究具体样本对模型的重要程度
资料获取
机器人知识
== 最新资讯 ==
ChatGPT:又一个“人形机器人”主题
ChatGPT快速流行,重构 AI 商业
中国机器视觉产业方面的政策
中国机器视觉产业聚焦于中国东部沿海地区(
从CHAT-GPT到生成式AI:人工智能
工信部等十七部门印发《机器人+应用行动实
全球人工智能企业市值/估值 TOP20
创泽智能机器人集团股份有限公司第十一期上
谐波减速器和RV减速器比较
机器人减速器:谐波减速器和RV减速器
人形机器人技术难点 高精尖技术的综合
机器人大规模商用面临的痛点有四个方面
青岛市机器人产业概况:机器人企业多布局在
六大机器人产业集群的特点
机械臂-高度非线性强耦合的复杂系统
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人开发平台

机器人开发平台


机器人招商 Disinfection Robot 机器人公司 机器人应用 智能医疗 物联网 机器人排名 机器人企业 机器人政策 教育机器人 迎宾机器人 机器人开发 独角兽 消毒机器人品牌 消毒机器人 合理用药 地图
版权所有 创泽智能机器人集团股份有限公司 中国运营中心:北京 清华科技园九号楼5层 中国生产中心:山东日照太原路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728