信也科技再创学术佳绩,金融需要科技支撑

前段时间,信也科技在学术领域又有所贡献,团队撰写的论文入选了顶尖国际会议,这说明了信也科技在相关领域的研究取得了重大进步,也说明了未来金融领域的发展态势,关于金融科技,信也科技有很多富有建设性的想法,可以进一步推动全行业发展 。
全新的嵌入式网络算法助力解决“金融欺诈”痛点
此次会议中,信也科技投递了名为《Financial Fraud Detection on Micro-credit Loan Scenario via Fuller Location Information Embedding》的论文 。据悉,该论文在组委会国内外知名学者专家的匿名评审后获得高度认可,并将在WWW会议上的金融科技主题讨论会进行专场分享 。
论文探讨了金融科技领域非常重要的话题——“金融欺诈检测”,它不仅是风险控制引擎的关键功能之一,也为利率定价政策提供了最有力的保证,是助力个人借款业务健康发展的重要工具之一 。
当传统金融欺诈检测手段无法满足金融科技的检测需求时,本论文中提出了一种以“互联网”的方法去解决问题的新思路,以数据驱动的算法作为金融欺诈检测的主要工具 。
信也科技提交的这篇论文重点讨论了新思路将如何融合表示用户数据,如何证明其有效性,以及如何用在具体的业务模型中:从用户相关的位置信息(比如线下用户提交申请的地点、身份证上的地址等)和相关数据中抽取相应的特征(例如客户行为、经济及社会相关的数据),构建地理位置的一个嵌入表示,并以此预测客户在未来一段时间内是否存在逾期的可能 。
图一:地址和房价信息对逾期的影响
论文论证了位置坐标和房价量化分析位置信息与欺诈行为之间的关系 。然而在实际工作中,很少有人关注这些信息 。这其中通常存在着利用位置信息的三大挑战:(1)数据稀疏性使金融欺诈检测模型难以充分学习到位置信息与欺诈行为之间的关系;(2)仅考虑位置信息而不具有居民个性的金融欺诈检测模型时,欺诈识别位置信息的能力被大大削弱;(3)位置信息的表示需要是有效且易于使用的,以便在下游任务中使用 。
信也科技的论文的一大贡献是提出了一种基于自动编码器的位置信息嵌入网络FLIE,它可克服上述挑战,将理论应用在实践中 。与原来的位置信息(用位置坐标表示)相比,FLIE不仅包含原坐标信息,还引入了位置坐标的其他属性,即社区坐标和社区信息 。此外,FLIE还考虑了客户的个性及行为数据,以增加客户区分度 。因此,FLIE的信息量比原始位置信息更为丰富(如图2所示) 。
图二:地址embedding FLIE的整体架构(图(a) 四类信息作为FLIE的输入,及embedding的模块化结果,图(b) encoding部分的结构)
为了更好的应对挑战,解决数据稀疏问题,FLIE进行了自监督学习 。相对于监督学习,自监督学习是从极不平衡数据中学习信息的更好选择 。同时,FLIE还将客户个性引入到位置信息嵌入中,克服个体差异,增强位置信息嵌入的欺诈识别能力 。我们的应用程序收集了丰富的经过授权的客户行为,这些信息隐含了客户的自然和社会属性,因此非常适合为位置信息嵌入补充个性化信息 。那么,FLIE探索了位置坐标、社区坐标、社区信息和客户行为之间的关系 。最后,FLIE用大量数据中学习嵌入的位置信息,取代人工制作的特征,解决了在下游任务中重复构建特征的问题 。信也科技论文采用了全局和局部的两层注意力机制,也是一个明显的特征,既简化了注意力模型的复杂度,又保证了整体模型特征的充分抽取(见图3) 。
图三:全局和局部注意力机制通用的模型结构
上述模型在现实中被用于风险控制中,包括了逾期客户预测和客户分群两大任务 。逾期客户预测涉及欺诈客户检测、信用额度和利率定价等应用 。客户分群的应用包括设置借款策略、营销、睡眠客户唤醒和对不同客户群的风险控制建模 。