敖翔
引言
党中央、国务院高度重视推进我国普惠金融发展。2015年我国印发了首个国家级普惠金融战略规划;2023年10月中央金融工作会议将“普惠金融”列为必须要做好的五篇大文章之一。发展普惠金融不仅是实现共同富裕的必然要求,也是金融行业提升服务质量和竞争力的首要之选。
近年来,随着移动互联网、大数据、人工智能等技术的广泛应用,数字普惠金融运用数字技术为传统金融无法覆盖的群体提供个性化、低成本、可持续的金融服务,其重要性日益凸显。2023年10月印发的《国务院关于推进普惠金融高质量发展的实施意见》专门提出要有序推进数字普惠金融发展。
然而,数字普惠金融面临突出安全风险。信息系统技术漏洞引致黑客攻击频发,数据安全风险激增;客群下沉叠加违约成本低廉,欺诈风险居高不下。这严重阻碍了数字普惠金融高质量发展,甚至对我国金融安全构成潜在威胁。因此,发展创新技术提升普惠金融系统的安全性和稳定性,已成为当前亟需解决的重要问题。

图1 项目主要成果概览
我所在的课题组自2018年以来,以网络平台中的用户复杂行为大数据为研究对象,基于深度序列建模、图机器学习、对抗训练方法等工具,针对用户复杂行为的时序长、类别偏、意图隐等挑战,突破了领域知识引导的长序列特征建模、拓扑动态平衡的图网络消息传递、隐蔽意图挖掘的对抗攻击防御三项关键技术,发表论文22篇,其中CCF A类会议13篇,2次获得CCF A/B类会议最佳论文提名,授权国家级发明专利20项,并在关键技术的支撑下布局数字金融平台风控业务,深挖用户数据价值,精准画像数字普惠金融服务群体,提升了平台风控能力,保障了人民群众财产安全。相关成果获2024年中国计算机学会科技进步二等奖。
针对网络平台用户复杂行为的“时序长、类别偏、意图隐”等挑战,我们突破了领域知识引导的长序列特征建模、拓扑动态平衡的图网络消息传递、隐蔽意图挖掘的对抗攻击防御关键技术,与国际同类技术相比取得领先,这三大关键技术突破包括:
领域知识引导的长序列特征建模 数字平台记录的用户行为数据通常具有多源、异构和高噪特性。与图像和自然语言数据相比,这种数据“信噪比”低,不利于深度学习方法直接学习与目标有关的特征表示,与欺诈有关的关键特征可能隐藏在大量正常时序行为之中。面对极其稀缺的欺诈关键特征,以往的欺诈检测算法需要依赖专家经验进行繁琐的特征工程,建模效率极低。不同于传统思路,我们提出了领域知识引导的长序列特征建模方法,该方法利用领域知识指导学习长序列行为的表征,通过新的表示方式,使深度学习模型能够更有效地从多源异构、高噪声的用户行为长序列数据中发现欺诈活动的关键特征,在欺诈交易识别、逾期用户预测等金融风控场景进行了实际应用。
拓扑动态平衡的图网络消息传递 少数的欺诈行为在反欺诈系统中反而是重点关注对象。传统图神经网络由于存在过度平滑问题,即随着网络层数增加,节点表征趋向于收敛到同一值,制约了少数类别节点特征的准确刻画。传统方法通常采用随机降/过采样或样本赋权等静态策略,直接提升“欺诈”样本在训练集中的比例。然而,这种思路可能在具有拓扑连接关系的图上产生连锁效应,加剧与原始数据建模的偏差。不同于传统思路,我们从图神经网络信息传递聚合机制入手,提出了局部拓扑动态平衡的图神经网络信息传递聚合策略。该策略在建模过程中动态地平衡目标节点邻域的样本类别分布,同时保持原始数据比例不变,有效克服了传统图神经网络不利于少数类别节点特征学习的局限。基于此策略的图神经网络算法在用户风险评估、额度评估、反身份盗用等普惠金融服务风控场景稳定规模化应用。
隐蔽意图挖掘的对抗攻击防御 欺诈者通常采用蓄意伪造行为攻击反欺诈系统,旨在干扰模型预测,这种攻击行为常表现为向数据中添加噪声。以复杂交互行为数据为例,若采用图机器学习技术建模,则欺诈者的攻击行为可表现为向图中注入了结构或属性噪声。这些噪声会随着信息传递聚合在图中广泛传播,从而严重损害图神经网络模型的判定能力,亟需提升图神经网络的对抗鲁棒性。传统方法依赖未被攻击的图数据生成攻击样本进行对抗学习,难以适用于存在隐蔽对抗意图的被攻击图。不同于传统方法,我们通过研究隐蔽对抗意图的攻防机理,揭示了欺诈者攻击行为在结构和属性方面的基本规律,提出了隐蔽意图挖掘的鲁棒防御方法,通过对连边进行量化评估,消除疑似噪声并插补缺失属性,有效提升了图神经网络的对抗鲁棒性,在信用风险防控、反电信诈骗等金融风控场景广泛应用。
目前,我们所提出的原创技术已在蚂蚁集团、阿里巴巴集团旗下的数字普惠金融服务中规模化应用,取得了可观的社会经济效益。代表性成果全面支撑蚂蚁智安智能风控系统,支持了多个普惠金融场景的反欺诈业务。相关关键技术还应用于阿里巴巴多个业务场景,增强了逾期用户预测、用户风险评估、授信额度评估和欺诈交易检测等任务性能。
作者简介

敖翔,男,中国科学院计算技术研究所研究员、博士生导师。研究方向为数据挖掘与自然语言处理。主持国家重点研发项目子课题1项,国家自然科学基金项目4项,CCF-腾讯犀牛鸟、阿里巴巴AIR计划、CAAI-Mindspore科研奖励基金等10余项科研项目,发表CCF A类论文50余篇,两次获得CCF A/B类会议最佳论文奖项。入选北京市杰青、北京市科技新星、中国科学院青促会、微软亚洲研究院“铸星计划”。
社科在线


