三大技术突破“护航”网络行为驱动的数字普惠金融风控-社科在线

敖翔

引言

党中央、国务院高度重视推进我国普惠金融发展。2015年我国印发了首个国家级普惠金融战略规划；2023年10月中央金融工作会议将“普惠金融”列为必须要做好的五篇大文章之一。发展普惠金融不仅是实现共同富裕的必然要求，也是金融行业提升服务质量和竞争力的首要之选。

近年来，随着移动互联网、大数据、人工智能等技术的广泛应用，数字普惠金融运用数字技术为传统金融无法覆盖的群体提供个性化、低成本、可持续的金融服务，其重要性日益凸显。2023年10月印发的《国务院关于推进普惠金融高质量发展的实施意见》专门提出要有序推进数字普惠金融发展。

然而，数字普惠金融面临突出安全风险。信息系统技术漏洞引致黑客攻击频发，数据安全风险激增；客群下沉叠加违约成本低廉，欺诈风险居高不下。这严重阻碍了数字普惠金融高质量发展，甚至对我国金融安全构成潜在威胁。因此，发展创新技术提升普惠金融系统的安全性和稳定性，已成为当前亟需解决的重要问题。

图1 项目主要成果概览

我所在的课题组自2018年以来，以网络平台中的用户复杂行为大数据为研究对象，基于深度序列建模、图机器学习、对抗训练方法等工具，针对用户复杂行为的时序长、类别偏、意图隐等挑战，突破了领域知识引导的长序列特征建模、拓扑动态平衡的图网络消息传递、隐蔽意图挖掘的对抗攻击防御三项关键技术，发表论文22篇，其中CCF A类会议13篇，2次获得CCF A/B类会议最佳论文提名，授权国家级发明专利20项，并在关键技术的支撑下布局数字金融平台风控业务，深挖用户数据价值，精准画像数字普惠金融服务群体，提升了平台风控能力，保障了人民群众财产安全。相关成果获2024年中国计算机学会科技进步二等奖。

针对网络平台用户复杂行为的“时序长、类别偏、意图隐”等挑战，我们突破了领域知识引导的长序列特征建模、拓扑动态平衡的图网络消息传递、隐蔽意图挖掘的对抗攻击防御关键技术，与国际同类技术相比取得领先，这三大关键技术突破包括：

领域知识引导的长序列特征建模 数字平台记录的用户行为数据通常具有多源、异构和高噪特性。与图像和自然语言数据相比，这种数据“信噪比”低，不利于深度学习方法直接学习与目标有关的特征表示，与欺诈有关的关键特征可能隐藏在大量正常时序行为之中。面对极其稀缺的欺诈关键特征，以往的欺诈检测算法需要依赖专家经验进行繁琐的特征工程，建模效率极低。不同于传统思路，我们提出了领域知识引导的长序列特征建模方法，该方法利用领域知识指导学习长序列行为的表征，通过新的表示方式，使深度学习模型能够更有效地从多源异构、高噪声的用户行为长序列数据中发现欺诈活动的关键特征，在欺诈交易识别、逾期用户预测等金融风控场景进行了实际应用。

拓扑动态平衡的图网络消息传递 少数的欺诈行为在反欺诈系统中反而是重点关注对象。传统图神经网络由于存在过度平滑问题，即随着网络层数增加，节点表征趋向于收敛到同一值，制约了少数类别节点特征的准确刻画。传统方法通常采用随机降/过采样或样本赋权等静态策略，直接提升“欺诈”样本在训练集中的比例。然而，这种思路可能在具有拓扑连接关系的图上产生连锁效应，加剧与原始数据建模的偏差。不同于传统思路，我们从图神经网络信息传递聚合机制入手，提出了局部拓扑动态平衡的图神经网络信息传递聚合策略。该策略在建模过程中动态地平衡目标节点邻域的样本类别分布，同时保持原始数据比例不变，有效克服了传统图神经网络不利于少数类别节点特征学习的局限。基于此策略的图神经网络算法在用户风险评估、额度评估、反身份盗用等普惠金融服务风控场景稳定规模化应用。

隐蔽意图挖掘的对抗攻击防御 欺诈者通常采用蓄意伪造行为攻击反欺诈系统，旨在干扰模型预测，这种攻击行为常表现为向数据中添加噪声。以复杂交互行为数据为例，若采用图机器学习技术建模，则欺诈者的攻击行为可表现为向图中注入了结构或属性噪声。这些噪声会随着信息传递聚合在图中广泛传播，从而严重损害图神经网络模型的判定能力，亟需提升图神经网络的对抗鲁棒性。传统方法依赖未被攻击的图数据生成攻击样本进行对抗学习，难以适用于存在隐蔽对抗意图的被攻击图。不同于传统方法，我们通过研究隐蔽对抗意图的攻防机理，揭示了欺诈者攻击行为在结构和属性方面的基本规律，提出了隐蔽意图挖掘的鲁棒防御方法，通过对连边进行量化评估，消除疑似噪声并插补缺失属性，有效提升了图神经网络的对抗鲁棒性，在信用风险防控、反电信诈骗等金融风控场景广泛应用。

目前，我们所提出的原创技术已在蚂蚁集团、阿里巴巴集团旗下的数字普惠金融服务中规模化应用，取得了可观的社会经济效益。代表性成果全面支撑蚂蚁智安智能风控系统，支持了多个普惠金融场景的反欺诈业务。相关关键技术还应用于阿里巴巴多个业务场景，增强了逾期用户预测、用户风险评估、授信额度评估和欺诈交易检测等任务性能。

作者简介

敖翔，男，中国科学院计算技术研究所研究员、博士生导师。研究方向为数据挖掘与自然语言处理。主持国家重点研发项目子课题1项，国家自然科学基金项目4项，CCF-腾讯犀牛鸟、阿里巴巴AIR计划、CAAI-Mindspore科研奖励基金等10余项科研项目，发表CCF A类论文50余篇，两次获得CCF A/B类会议最佳论文奖项。入选北京市杰青、北京市科技新星、中国科学院青促会、微软亚洲研究院“铸星计划”。

三大技术突破“护航”网络行为驱动的数字普惠金融风控

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续给力更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫打赏

微信扫一扫打赏