百度入选ICML、IJCAI、ISIT等机器学习顶会的论文都在关注什么?( 四 )


在本文中 , 我们提出了一种新的医疗文本处理框架Seq2Subgraph , 它通过结合医学知识图谱 , 将医疗文本处理成多层级的子图结构 , 改变了传统NLP序列模型处理医疗文本的固定套路 , 能更好的区分同时患有多疾病的病历中不同疾病关联的病情信息 , 兼顾医疗文本的结构特征和序列特征 。在中文和英文电子病历数据上 , 本文提出的算法均取得了最佳的效果 。
值得一提的是 , 该工作是继2020年ACL和IJCAI后 , 百度智慧医疗在AI辅助诊断上的延续性技术创新 。在突破了诊断可解释性和知识与数据双驱动诊疗技术后 , 本次研究进一步革新了医疗文本处理模式 , 在维度升级的复杂电子病历下 , 针对数据与知识的联合建模方式做了更深层次的探索和应用 。
百度入选ICML、IJCAI、ISIT等机器学习顶会的论文都在关注什么?
文章图片

文章图片
9.监控场景下的弱监督时空异常检测
Weakly-Supervised Spatio-Temporal Anomaly Detection in Surveillance Video
针对视频监控场景下的异常事件检测 , 我们提出弱监督时-空异常检测(WSSTAD)的新任务 。即 , 仅仅利用视频级别标签作为弱监督信号 , 对输入的一段视频中异常事件出现的时间以及空间位置进行检测 。前序研究中 , 弱监督方法仅能实现单一时间纬度的异常定位 , 无法进行空间位置的定位 。本文提出的弱监督算法框架 , 首次实现了时间-空间两个纬度的异常事件定位 , 并且在经典数据集中取得了最佳的指标 。由于训练阶段仅需要视频级别的标签 , 本文提出的方法可以极大节省标注人力 。
具体而言 , 我们采用多实例学习框架(MIL) , 首先会从输入视频中提取不同粒度的时-空proposal作为实例 , 其中包括由连续帧中检测框所组成的tube实例 , 以及由视频片段组成的videolet实例 。随后 , 将tube实例以及videolet实例分别送入一个双分支的网络 , 在每个网络分支中 , 采用C3D提取特征 , 并采用注意力机制实现特征增强 。最后 , 通过两个分支之间的互助损失 , 实现时-空两个维度定位的互助学习 。整体算法框架如下图所示 。本文提出的方法在ST-UCF-Crime以及新提出的STRA两个数据集上获得了最佳的效果 , VAUC分别达到了87.65%和92.88% 。
百度入选ICML、IJCAI、ISIT等机器学习顶会的论文都在关注什么?
文章图片

文章图片
10.DU-VAE: 从隐变量空间多样性和不确定的角度增强变分自编码器
Regularizing Variational Autoencoder with Diversity and Uncertainty Awareness
作为最受欢迎的生成式表征模型之一 , 变分自编码器近年来已经被应用于各个领域 。然而在具体实践中 , 当我们使用拟合能力很强的模型作为解码器时 , 变分自编码器时常会遇到后验坍缩(posterior collapse) 现象 。彼时 , 所有样本的隐变量后验分布趋近于相同 , 模型无法学习到有效的表征 。
针对于这一问题 , 本文首先从隐变量空间的多样性与不确定性两种几何特性出发 , 分析发现只需要简单控制后验参数的分布 , 就可以有效地避免后延坍缩现象 。并以此为理论依据提出 , 通过对于后验参数同时使用批处理标准化(Batch Normalization)与Dropout正则化 , 实现对于后验参数的控制 。在三个公开数据集上的数值试验表明 , 该算法有效地提升了变分自编码器的性能 , 在数据拟合与分类任务中都取得了最好的效果 。
百度入选ICML、IJCAI、ISIT等机器学习顶会的论文都在关注什么?
文章图片

文章图片
11.关于神经网络泛化、记忆与频谱偏好的再思考