探索发现 · 交大智慧

上海交大计算机学院异构联邦学习领域研究成果获得国际认可

近日,上海交通大学计算机学院智能软件技术与系统所博士生张剑清作为第一作者、曹健教授作为通讯作者完成的论文《HtFLlib: A Comprehensive Heterogeneous Federated Learning Library and Benchmark》在数据挖掘国际顶级会议KDD 2025上荣获“数据集与基准测试”赛道最佳论文Runner Up奖(该类别共3篇最佳论文)。该论文从众多投稿中脱颖而出,被评审者认为填补了该领域内标准化评估框架的空白,彰显了研究团队在联邦学习领域的学术影响力。

论文重点介绍了由张剑清同学发起并主导的开源项目HtFLlib(项目地址:https://github.com/TsingZ0/HtFLlib)。HtFLlib是一个支持客户端使用异构模型进行协同训练的联邦学习框架。在实际应用中,由于终端设备在算力、存储等方面的差异,或任务本身对模型规模存在特定需求,各客户端常需采用不同结构的模型。然而,现有联邦学习框架普遍缺乏对这类异构场景的系统性支持。HtFLlib填补了这一空白,通过设计轻量级的信息传递机制,使得架构各异的模型能够在统一平台中高效协同训练。

目前,HtFLlib已支持40种异构模型、3种数据模态(图像、文本、传感器数据)以及10类主流异构联邦学习算法,具备高度的可扩展性——用户仅需修改两个配置文件即可快速集成新算法。

图片1.png

图:HtFLlib 项目总览

在曹健教授的指导下,张剑清同学致力于个性化联邦学习的研究。他牵头开发的另一开源项目PFLlib(https://www.pfllib.com/)专注于数据异构场景下的联邦学习的统一评估框架。PFLlib包含了39种联邦学习算法、3种数据异质场景和24个数据集,支持快速模拟多达500个设备的训练场景,并提供隐私保护能力评估工具。PFLlib目前已经获得1800+个Star和300+个Fork。PFLlib与HtFLlib共同成为该领域的重要基础平台,被多家国内外机构应用于科研与工程实践。基于这两个平台的高易用性和扩展性,张剑清已以第一作者身份完成9篇CCF-A类论文,积累了显著的学术影响力。

目前,课题组正积极推进HtFLlib在边缘计算环境中的部署应用,致力于实现“边采集数据,边训练模型”。该系统已在48类异构设备(包括不同型号的单片机、手机等)上成功运行异构模型协同训练,进一步拓展了联邦学习在资源受限场景下的适用边界。

计算机学院
计算机学院(网络空间安全学院、密码学院)