百度入选ICML、IJCAI、ISIT等机器学习顶会的论文都在关注什么?( 六 )
文章图片
文章图片
14.基于模式扩展的对抗策略学习网络在序列推荐中的应用
Pattern-enhanced Contrastive Policy Learning Network for Sequential Recommendation
本论文跟北京邮电大学、武汉大学多位教授合作 , 关注的是序列推荐场景中对用户历史序列的去噪问题 。由于用户行为的随机性和多样性 , 用户的历史记录中并不是所有的商品都对预测下一次的行为有帮助 。大多数序列推荐方法都无法抽取出与目标商品存在可信赖的序列依赖关系 , 模型的可解释性也受到了很大的限制 。我们希望从历史购物序列中挑选出对预测具有真正影响力的相关商品 , 去除序列中不相关的商品 , 从而提升序列推荐效果 。如何在无标注的情况下 , 自动挖掘出与推荐结果相匹配的时序模式 , 提高推荐的可解释性和准确性 , 是本文最大的挑战 。基于以上几点考虑 , 我们把序列去噪问题形式化为一个马尔可夫决策过程 , 将挖掘出来的序列模式用以增强每个商品的表达 , 作为指导去噪过程的一种先验知识 。然后采用一种强化学习的策略模块 , 来判定用户购物序列中的商品与目标商品之间的关联性 , 从而将相关和不相关的商品区分开 , 并通过一个对比学习模块来加强模型的学习进程 。实验结果表明 , 我们提出的方法可以有效地提取出相关商品并提升推荐效果 。
文章图片
文章图片
15.基于语义共享模型的有监督跨模态检索
Rethinking Label-Wise Cross-Modal Retrieval from A Semantic Sharing Perspective
有监督跨模态检索是当前多模态领域的研究热点 , 旨在利用一种模态的样本去检索其他模态相似语义的样本 。由于不同模态特征表示的差异性(异构鸿沟) , 跨模态检索需要为不同模态学习语义一致的特征表示 。传统方法通常使用真实标签和一致性损失来约束模态内和模态间的特征表示 , 但忽略了一致性损失对于各模态分类性能的影响 。
本文重新思考了一致性损失对有监督跨模态检索的影响 , 发现由于不同模态的嵌入模型具有不同的泛化性能 , 使用一致性损失的端到端联合学习会导致各模态的分类性能下降 , 进而影响跨模态语义一致特征表示的学习 。为此 , 本文提出一种基于语义共享分类模型的有监督跨模态检索方法 , 该模型直接采用基于自注意力的共享分类模型 , 并对两个模态进行迭代训练 , 保证各模态在共享模型上的分类性能 , 进而学习语义一致的特征表示 , 以此提升各模态的检索性能 。实验表明 , 在图像-文字跨模态检索的标签任务上 , 所提方法在NDCG指标下取得了比现有技术更高的检索性能 。
百度ISIT 2021论文
文章图片
文章图片
16.乱序稀疏信号恢复的理论分析和实际算法
Sparse Recovery with Shuffled Labels: Statistical Limits and Practical Estimators
我们首次考虑了在乱序情况下恢复稀疏信号 。相较之前的工作 (需要观测数量n大于二倍的信号长度p) , 我们的工作首次考虑了n小于p的情况 。假设稀疏信号只有个非零元素 , 我们的目标是同时恢复排列关系和稀疏信号的支撑集两个信息 。这个工作主要有三方面的贡献:
1)首次得到了正确恢复上述两个信息说需要的最少观测数量n和最低信噪比SNR 。值得注意的是 , 我们对上述SNR的最低要求给出了一个基于香农编码理论的非常直观的解释 。大致思路是将观测关系建模成一个通信过程(如下图所示) , 基于香农的理论 , 正确的解码需要码率小于信道容量 , 借此我们可以得到关于SNR的最低要求 。
- 百度地图升级智能手表导航 可查看公交地铁到站提醒
- 威海3个项目入选工信部示范项目公示名单
- 喜报|《乘风破浪去远洋》入选自然资源部2021年优秀科普图书名单
- 百度地图新增新能源导航2.0,号称智能充电规划,长途放心出发
- 百度与美团等十余家企业互联互通,春节开放百亿流量拆互联网围墙
- 全省唯一!威海一平台入选首批国家级纺织服装创意设计示范园区(平台)
- 徐彦辉团队科研成果入选2021年度“中国生命科学十大进展”
- 云朵软件“基于大数据的‘烟台文旅云’平台”入选文化和旅游部《2021年智慧旅游典型案例》
- 两年内有望实现“数字人自由”?百度希望通过平台输出落地能力
- 他趣入选新一批厦门市重点上市后备企业名单 肩负更大责任与担当