近日,东南大学网络空间安全学院张静教授团队研究成果被第42届国际机器学习会议(Forty-Second International Conference on Machine Learning,ICML-2025)录用。论文第一作者为张静教授团队2024级博士研究生蒋晓倩。张静教授为论文通讯作者。该研究受东南大学博士研究生创新能力提升计划资助。
论文题目为“FedClean: A General Robust Label Noise Correction for Federated Learning”。论文针对联邦学习(Federated Learning)在实际部署中普遍面临的标签噪声(Label Noise)问题,尤其是在所有客户端均存在噪声且数据不可共享的隐私约束环境下,提出了一种通用且高鲁棒性的标签噪声纠正机制FedClean。现有方法普遍依赖“存在部分干净客户端”的前提假设,导致方法的鲁棒性不足且存在泄露客户端数据信息的潜在风险。FedClean摒弃了此类假设,设计了一种不依赖先验假设,能够适应高度异构数据和系统环境的通用框架。具体而言,FedClean提出了一种两阶段标签纠正策略,分别以本地模型推断标签和全局模型预测标签为主导,实现从多个视角对噪声标签进行校正。此外,论文引入了创新的协同样本损失函数(Collaborative Per-sample Loss)来量化标签间一致性,并提出基于干净样本数量的自适应聚合方法(ASSA),有效地抑制了标签噪声对全局模型的负面影响。为进一步增强隐私保护,FedClean还结合零知识证明机制(zkCor),确保标签纠正过程在联邦学习架构下的可验证性与隐私安全。实验证明,FedClean在独立同分布和非独立同分布的多个数据集上均显著优于现有最先进方法,尤其在所有客户端均存在噪声环境中展现出很强的鲁棒性与稳定性。
论文研究思路框架图
ICML会议是机器学习领域最具影响力的学术会议之一,于1983年首次举办,已有四十多年历史,与NeurIPS、ICLR并称为机器学习领域的三大顶级学术会议,也是中国计算机学会(CCF)推荐的A类会议。本年度ICML会议收到了12,107篇投稿,最终录用率约为26.9%,被录用的论文反映了课题组在安全可信人工智能领域的研究取得了长足进展。博士生蒋晓倩近日还获得了国家留学基金委(CSC)资助,年内将赴穆罕默德·本·扎耶德人工智能大学(Mohamed bin Zayed University of Artificial Intelligence,简称MBZUAI)进行为期2年的联合培养。MBZUAI成立于2019年,位于我国“一带一路”战略重要支点国家阿联酋首都阿布扎比,是全球第一所专注于人工智能技术的研究型大学。
(文字:张静 审核:张璐)