探索发现 · 交大智慧
上海交大毛亚飞团队与合作者利用完整参考基因组精细分析现代人基因组中尼安德特渗入序列
2025年2月17日,上海交通大学毛亚飞团队和复旦大学陈璐团队合作在Genome Biology期刊上发表了文章A Refined Analysis of Neanderthal-Introgressed Sequences in Modern Humans with a Complete Reference Genome。该研究表明,完整参考基因组T2T-CHM13在鉴定现代人群中尼安德特渗入序列方面具有显著优势,并深入解析了T2T-CHM13特异性远古人类渐渗信号及其基因组特性,阐明了群体特异性古人遗传变异对功能表型的全新影响。
随着考古学和现代进化遗传学等学科的交叉融合,尼安德特人和丹尼索瓦人等远古人类基因组数据的有效获取使得古人类与现代人类之间的基因混合研究成为可能。相关研究揭示了古人渗入序列在现代人类遗传结构和进化适应中的独特遗传贡献。因此,准确鉴定现代人类基因组中的远古人类渗入基因序列,对于理解人群混合中渗入序列的遗传特征、功能特性、表型进化影响等至关重要。
当下,古人渐渗研究长期依赖于GRCh37(hg19)人类参考基因组,但该基因组参考序列存在大量未组装或组装错误的基因组区域,阻碍了我们对于古人渐渗的全面理解。T2T-CHM13作为首个完整人类基因组,填补了先前未测序或错误组装的参考基因组区域。因此,T2T-CHM13基因组的高度完整性为我们重新评估和深化现代人群中远古人类渗入序列的理解提供了独特机会。
研究人员将阿尔泰尼安德特人和丹尼索瓦人的高覆盖度基因组测序数据分别比对到GRCh37、GRCh38(hg38)和T2T-CHM13参考基因组,获得三组古人基因组遗传变异图谱。进一步,研究人员利用团队先前开发的IBDmix方法,基于1000 Genomes Project(1KGP)中2504个非亲缘个体遗传变异数据以及古人基因组遗传变异图谱,分别鉴定了基于三个参考基因组的1KGP现代人群全基因组尼安德特渗入序列,并解析出T2T-CHM13特有的基因组渐渗区域与群体特异的适应性渗入信号。
研究人员首先比较了不同参考基因组下古人测序数据的比对质量。结果发现,相较于GRCh38,T2T-CHM13额外比对约1.9×10⁷条尼安德特人测序读段,全基因组比对率显著提高,近端着丝粒染色体比对率从约80%提升至>95%。Wilcoxon秩和检验显示,T2T-CHM13提升了尼安德特测序数据的覆盖均一性,显著提高了测序数据的比对质量,同时,在丹尼索瓦人数据分析亦得出相同结论。
研究人员在检测古人基因渐渗时,发现GRCh38和T2T-CHM13版本的1KGP公开遗传变异数据集采用的预过滤策略存在显著差异。T2T-CHM13版本的1KGP公开数据集中采用的更严格的变异质量评分(VQSLOD)过滤了大量变异位点,从而在IBDmix算法逻辑下显著减少了尼安德特人序列鉴定。因此,该研究统一采用GRCh38的预过滤策略,以确保高质量数据并避免过度过滤,强调了二代测序数据过滤策略选择的重要性。
基于统一的遗传变异数据预过滤策略,研究人员分析了在T2T-CHM13新鉴定出的尼安德特序列。结果发现相比于GRCh38,使用T2T-CHM13使得现代人群体中检测到的尼安德特序列含量大约多出1Mb/人,新鉴定到尼安德特渗入的基因组区域共51.3Mb,其中1.68Mb位于T2T-CHM13“新解析”区域。
随后研究人员进一步分析了T2T-CHM13新鉴定出的尼安德特渗入片段的产生原因。结果发现约75%的尼安德特渐渗新区域与4,196个T2T-CHM13相较于GRCh38特有的组装遗传变异(插入、缺失、倒位)重叠,这些参考基因组组装变异大小从10bp到1.16Mb不等,足以影响古人数据的比对与变异鉴定质量。其中,T2T-CHM13的9号染色体上的~1kb插入变异(chr9_110M)使得该区域首次鉴定出尼安德特渗入序列,并且相关渗入序列广泛存在于非洲以外人群(群体频率大于5%)。有趣的是,该基因组区域与先天性重症肌无力综合征相关的MUSK基因重合。
研究人员分析检测了群体特异的适应性渗入信号。研究表征了T2T-CHM13中94个现代人特异高频尼安德特单倍型,其中10个为全新发现的单倍型,包括2个非洲特异、2个非非洲共享、4个非洲/欧洲共享以及2个非洲/东亚共享高频单倍型。相关单倍型包含代谢、离子通道、嗅觉及癌症等相关基因。以上研究表明了完整参考基因组可揭示新的适应性渗入信号,深化我们对人类进化与基因选择的理解。
最后,为利于古人渐渗相关研究,该研究还开发了一个集成GRCh37、GRCh38和T2T-CHM13尼安德特渗入序列的用户友好型在线数据库网站:ArcSeqHub(ASH, http://www.arcseqhub.com)。ASH提供“基因查询”和“基因组区间查询”两种搜索方式,并能对尼安德特渗入序列、功能基因及人群/个体的渐渗比例等进行可视化展示。ASH中的相关原始数据均可免费下载。因此,ASH有助于医学和进化生物学相关科研人员更为便捷地获取和使用古人渐渗遗传变异相关信息。
综上,该研究提升了现代人类中远古人类变异的检测能力,强调完整参考基因组T2T-CHM13在古人渐渗研究中的应用价值,突出了针对具体研究场景选择二代测序数据预处理过滤参数的重要性,提供了远古人类渗入变异可视化数据库,为解析古人类遗传变异、功能及进化意义提供了新视角。
复旦大学博士生梁申奥、上海交通大学研究生任天鑫和复旦大学博士生张家瑜为论文共同第一作者。复旦大学青年研究员陈璐和上海交通大学副教授毛亚飞为本文的共同通讯作者。本研究得到了中国科学院古脊椎动物和古人类研究所付巧妹研究员的重要支持。
论文链接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-025-03502-z