信也科技受邀参加第30届WWW国际顶级学术会议,展现新成果

近日 , 由信也科技人工智能团队几位专家联合撰写的《Financial Fraud Detection on Micro-credit Loan Scenario via Fuller Location Information Embedding》的学术论文 , 成功入选The International World Wide Web Conference - WWW2021(以下简称“WWW2021”) 。此举意味着信也科技的科技研发能力再一次得到认可 。除此之外 , 信也科技也受邀参加了该国际会议 , 与行业伙伴共同分享交流行业发展新趋势 。
全新的嵌入式网络算法助力解决“金融欺诈”痛点
此次会议中 , 信也科技投递了名为《Financial Fraud Detection on Micro-credit Loan Scenario via Fuller Location Information Embedding》的论文 。据悉 , 该论文在组委会国内外知名学者专家的匿名评审后获得高度认可 , 并将在WWW会议上的金融科技主题讨论会进行专场分享 。
论文探讨了金融科技领域非常重要的话题——“金融欺诈检测” , 它不仅是风险控制引擎的关键功能之一 , 也为利率定价政策提供了最有力的保证 , 是助力个人借款业务健康发展的重要工具之一 。
当传统金融欺诈检测手段无法满足金融科技的检测需求时 , 本论文中提出了一种以“互联网”的方法去解决问题的新思路 , 以数据驱动的算法作为金融欺诈检测的主要工具 。
论文重点讨论了新思路将如何融合表示用户数据 , 如何证明其有效性 , 以及如何用在具体的业务模型中:从用户相关的位置信息(比如线下用户提交申请的地点、身份证上的地址等)和相关数据中抽取相应的特征(例如客户行为、经济及社会相关的数据) , 构建地理位置的一个嵌入表示 , 并以此预测客户在未来一段时间内是否存在逾期的可能 。论文设计和探索了与位置(地址)相关的新信息 , 这些信息被证实是金融欺诈检测的重要因素之一(如图1) 。
图一:地址和房价信息对逾期的影响
论文论证了位置坐标和房价量化分析位置信息与欺诈行为之间的关系 。然而在实际工作中 , 很少有人关注这些信息 。这其中通常存在着利用位置信息的三大挑战:(1)数据稀疏性使金融欺诈检测模型难以充分学习到位置信息与欺诈行为之间的关系;(2)仅考虑位置信息而不具有居民个性的金融欺诈检测模型时 , 欺诈识别位置信息的能力被大大削弱;(3)位置信息的表示需要是有效且易于使用的 , 以便在下游任务中使用 。
论文的一大贡献是提出了一种基于自动编码器的位置信息嵌入网络FLIE , 它可克服上述挑战 , 将理论应用在实践中 。与原来的位置信息(用位置坐标表示)相比 , FLIE不仅包含原坐标信息 , 还引入了位置坐标的其他属性 , 即社区坐标和社区信息 。此外 , FLIE还考虑了客户的个性及行为数据 , 以增加客户区分度 。因此 , FLIE的信息量比原始位置信息更为丰富(如图2所示) 。
图二:地址embedding FLIE的整体架构(图(a) 四类信息作为FLIE的输入 , 及embedding的模块化结果 , 图(b) encoding部分的结构)
为了更好的应对挑战 , 解决数据稀疏问题 , FLIE进行了自监督学习 。相对于监督学习 , 自监督学习是从极不平衡数据中学习信息的更好选择 。同时 , FLIE还将客户个性引入到位置信息嵌入中 , 克服个体差异 , 增强位置信息嵌入的欺诈识别能力 。我们的应用程序收集了丰富的经过授权的客户行为 , 这些信息隐含了客户的自然和社会属性 , 因此非常适合为位置信息嵌入补充个性化信息 。那么 , FLIE探索了位置坐标、社区坐标、社区信息和客户行为之间的关系 。最后 , FLIE用大量数据中学习嵌入的位置信息 , 取代人工制作的特征 , 解决了在下游任务中重复构建特征的问题 。论文采用了全局和局部的两层注意力机制 , 也是一个明显的特征 , 既简化了注意力模型的复杂度 , 又保证了整体模型特征的充分抽取(见图3) 。