探索发现 · 交大智慧

上海交大溥渊未来技术学院辛弘毅团队Novellab实验室2篇论文入选国际计算生物学顶级会议RECOMB 2026

近日,上海交通大学溥渊未来技术学院辛弘毅老师团队Novellab实验室在国际计算生物学顶级学术会议 RECOMB 2026(Research in Computational Molecular Biology) 上取得重要进展,共有两篇研究论文被大会正式录用,分别聚焦于单细胞与空间转录组数据分析中的几何建模方法以及鲁棒细胞身份识别理论。

两篇论文题目分别为:

· Information Geometry Reconciles Discrete and Continuous Variation in Single-Cell and Spatial Transcriptomic Analysis

· Gene-First Identity Construction for Robust Cell Identification in Single-Cell Transcriptomics

该成果标志着溥渊未来技术学院在计算生物学、单细胞组学与理论建模方向的持续突破。

会议简介 Conference Introduction

RECOMB(Research in Computational Molecular Biology)是计算生物学与生物信息学领域公认的国际顶级学术会议,长期聚焦于算法、统计理论、机器学习与生命科学核心问题的深度交叉,在全球范围内具有极高的学术影响力。RECOMB 2026年度会议将在2026年5月26-29日召开。

论文一: Information Geometry Reconciles Discrete and Continuous Variation in Single-Cell and Spatial Transcriptomic Analysis

研究背景 Research Background

单细胞与空间转录组技术的快速发展,使研究者能够以前所未有的精度刻画细胞状态、发育轨迹及空间组织结构。然而,现有分析方法在度量细胞相似性时,普遍依赖欧氏距离或对数变换后的表达空间,这在理论上与转录本计数的概率生成机制并不一致,容易引入对基因选择、表达尺度和测序深度高度敏感的分析偏差。

研究成果 Research Results

IMG_256

图1: 针对信息几何的单细胞组学分析框架GAIA

为解决单细胞数据中归一化依赖强、batch effect 明显等问题,Novellab 实验室从信息几何(Information Geometry)的角度出发,提出了全新的分析框架GAIA(Geometric Analysis from an Information Aspect)。该方法将每个细胞视为一个基因表达的概率分布,并以Fisher–Rao信息度量来定义细胞之间的“距离”。

这一思想在概念上与广义相对论高度相似:在相对论中,物体之间的距离由度量张量(metric tensor)决定,而非固定的欧氏坐标;在GAIA中,Fisher信息度量扮演了类似角色,刻画的是细胞表达状态的内在几何结构,而不是依赖人为设定的归一化或基因筛选。

在这一统一的几何框架下,细胞间的相似性自然表现为单位超球面上的测地距离,从而同时捕捉基因表达的定量变化与定性差异。相较传统方法,GAIA 能在无需复杂预处理的情况下稳定保持细胞间相对关系,并显著降低由测序深度差异引入的batch effect。

实验结果显示,该方法在单细胞 RNA 测序与空间转录组数据中均能更清晰地揭示细胞状态结构与空间分区,为单细胞分析提供了一种更稳健、可解释、具有“几何不变性”思想的新范式。

本文第一作者是浦江国际学院2021级博士生蔡金蒲,通讯作者为Fred Hutchinson Cancer Center的Jingyi Jessica Li教授和辛弘毅教授。

论文二: Gene-First Identity Construction for Robust Cell Identification in Single-Cell Transcriptomics

在大规模单细胞图谱时代,准确的细胞类型定义已成为计算生物学的核心挑战之一。其中大规模数据中,细胞身份具有天然的多层级结构,但现有聚类流程经常违反层次一致性的原则。核心难题在于区别不同层级聚类所依赖的基因程序不同,而一旦允许细胞之间的相似性对随细胞对而变,会破坏下游分析所需的全局几何一致性。

针对上述问题,Novellab实验室提出了新的计算框架GeCCo (Gene Co-expression Constructed identity),将细胞聚类的范式从以细胞为中心转向以基因为中心,量化基因之间的协同与拮抗关系,通过启发式贪心算法构建基因层级,从而自适应性得到各个分辨率的细胞身份。该框架在局部相似度量与全局几何一致之间建立了可兼容的统一结构,从而保证了细胞在不同层次中聚类的一致性。

IMG_257

图2: 将细胞身份锚定在预先计算的基因层级上

在结果层面,GeCCo框架在人体骨髓真实数据上展示出了稳健的层次一致性,同时在胰腺数据中识别到新的细胞分化前过渡状态,为构建多层级细胞身份图谱提供了一个更加稳健的范式。

溥渊未来技术学院博士生杨陆奇和浦江国际学院本科生黄溱洧(溥渊未来学者计划)为论文的第一作者,辛弘毅教授为论文的通讯作者。

Novellab实验室的两项研究工作,分别从信息几何理论建模与细胞身份构建范式两个层面,系统性地回应了单细胞与空间转录组分析中长期存在的核心问题,为构建更加稳健、可解释、低依赖先验的分析方法提供了新的理论基础。

相关成果不仅对基础研究具有重要意义,也为精准医学与复杂组织解析提供了新的技术路径。

作者简介

01.png

蔡金蒲

上海交通大学浦江国际学院博士生,曾在北京协和医学院阜外医院、国家心血管病中心联合培养。主要研究方向为单细胞多组学数据分析及心血管疾病机制研究。相关研究成果以第一作者身份在 Briefings in Bioinformatics、RECOMB、ACM-BCB 等国际期刊与会议发表论文 6 篇,曾获 ACM-BCB Best Paper Award。

02.png

杨陆奇

上海交通大学溥渊未来技术学院23级硕博连读博士生,研究领域为单细胞多组学数据中的细胞与基因表征,以及在聚类,轨迹推断等领域的应用。

03.png

黄溱洧

上海交通大学浦江国际学院22级本科生,溥渊未来技术学院26级准博士生。研究领域为单细胞多组学数据分析。《基于单细胞组学算法整合的软件开发》项目于溥渊未来学者计划第四期立项。

通讯作者简介

04.png

Jingyi Jessica Li

Jingyi Jessica Li,博士,现任 Fred Hutchinson 癌症研究中心(Fred Hutch)公共卫生科学部生物统计学项目主任(Program Head)及教授,同时担任 Herbold 计算生物学项目教授,并为 University of Washington的统计系、生物统计系、Genome Sciences系(基因组科学系)的Affiliate Professor。她同时担任 Donald and Janet K. Guthrie 统计学冠名讲席教授。李教授是活跃于统计学与生物学交叉领域的国际知名统计学家,长期致力于开发可靠、可解释的统计方法,用于分析复杂生物数据,重点研究基因在健康与疾病状态下的功能及调控机制。其研究强调统计严谨性(statistical rigor),旨在在存在噪声、偏倚及数据质量受限的情况下,仍能获得可信、可重复的科学发现。她的学术贡献获得了众多荣誉与奖项的认可,其中包括 NSF CAREER 奖、斯隆研究学者奖(Sloan Research Fellowship)、ISCB Overton 奖、COPSS 新兴领袖奖(Emerging Leaders Award)、古根海姆奖学金(Guggenheim Fellowship) 以及 Mortimer Spiegelman 奖。

05.jpg

辛弘毅

辛弘毅,博士,上海交通大学溥渊未来技术学院长聘教轨副教授,同时受聘于电子信息与电气工程学院自动化系,国家级青年人才。博士毕业于卡内基梅隆大学计算机科学系,曾在美国匹兹堡大学医学院从事博士后研究。辛弘毅副教授长期从事生物信息学与人工智能交叉研究,聚焦于单细胞与多组学数据分析的机器学习与统计方法,并将相关方法应用于癌症、免疫学及精准医学等重要生物医学问题。同时,他在组合优化算法以及稳定、可解释人工智能方法方面也开展了系统研究。其研究成果发表在 Genome Biology、Nature Machine Intelligence、Nature Communications、Nucleic Acids Research、Cell Reports 等国际顶级期刊,并多次在 RECOMB、ISMB 等计算生物学顶级国际会议上进行首要报告。曾入选腾讯“犀牛鸟”人才计划。

溥渊未来技术学院辛弘毅老师团队
溥渊未来技术学院