百度入选ICML、IJCAI、ISIT等机器学习顶会的论文都在关注什么？( 四 ) 2021年

在本文中，我们提出了一种新的医疗文本处理框架Seq2Subgraph ，它通过结合医学知识图谱，将医疗文本处理成多层级的子图结构，改变了传统NLP序列模型处理医疗文本的固定套路，能更好的区分同时患有多疾病的病历中不同疾病关联的病情信息，兼顾医疗文本的结构特征和序列特征。在中文和英文电子病历数据上，本文提出的算法均取得了最佳的效果。
值得一提的是，该工作是继2020年ACL和IJCAI后，百度智慧医疗在AI辅助诊断上的延续性技术创新。在突破了诊断可解释性和知识与数据双驱动诊疗技术后，本次研究进一步革新了医疗文本处理模式，在维度升级的复杂电子病历下，针对数据与知识的联合建模方式做了更深层次的探索和应用。

文章图片

文章图片
9.监控场景下的弱监督时空异常检测
Weakly-Supervised Spatio-Temporal Anomaly Detection in Surveillance Video
针对视频监控场景下的异常事件检测，我们提出弱监督时-空异常检测（WSSTAD）的新任务。即，仅仅利用视频级别标签作为弱监督信号，对输入的一段视频中异常事件出现的时间以及空间位置进行检测。前序研究中，弱监督方法仅能实现单一时间纬度的异常定位，无法进行空间位置的定位。本文提出的弱监督算法框架，首次实现了时间-空间两个纬度的异常事件定位，并且在经典数据集中取得了最佳的指标。由于训练阶段仅需要视频级别的标签，本文提出的方法可以极大节省标注人力。
具体而言，我们采用多实例学习框架（MIL），首先会从输入视频中提取不同粒度的时-空proposal作为实例，其中包括由连续帧中检测框所组成的tube实例，以及由视频片段组成的videolet实例。随后，将tube实例以及videolet实例分别送入一个双分支的网络，在每个网络分支中，采用C3D提取特征，并采用注意力机制实现特征增强。最后，通过两个分支之间的互助损失，实现时-空两个维度定位的互助学习。整体算法框架如下图所示。本文提出的方法在ST-UCF-Crime以及新提出的STRA两个数据集上获得了最佳的效果， VAUC分别达到了87.65%和92.88% 。

文章图片

文章图片
10.DU-VAE: 从隐变量空间多样性和不确定的角度增强变分自编码器
Regularizing Variational Autoencoder with Diversity and Uncertainty Awareness
作为最受欢迎的生成式表征模型之一，变分自编码器近年来已经被应用于各个领域。然而在具体实践中，当我们使用拟合能力很强的模型作为解码器时，变分自编码器时常会遇到后验坍缩(posterior collapse) 现象。彼时，所有样本的隐变量后验分布趋近于相同，模型无法学习到有效的表征。
针对于这一问题，本文首先从隐变量空间的多样性与不确定性两种几何特性出发，分析发现只需要简单控制后验参数的分布，就可以有效地避免后延坍缩现象。并以此为理论依据提出，通过对于后验参数同时使用批处理标准化(Batch Normalization)与Dropout正则化，实现对于后验参数的控制。在三个公开数据集上的数值试验表明，该算法有效地提升了变分自编码器的性能，在数据拟合与分类任务中都取得了最好的效果。

文章图片

文章图片
11.关于神经网络泛化、记忆与频谱偏好的再思考