十大科技进展
上海交通大学第五届十大科技进展入选项目_蛋白质工程通用 AI设计平台
— 十大科技进展【项目名称】
蛋白质工程通用 AI设计平台
【项目负责人】

洪亮
【项目完成人】

洪亮,周冰心,周子宜,李明辰,姜帆,余元玺
【项目完成单位】
自然科学研究院
【项目简介】
蛋白质是生命活动的核心执行者,其功能设计是解决生物医药与合成生物学“卡脖子”难题的关键。针对传统蛋白质设计周期长、成功率低,以及现有AI模型(如AlphaFold)重结构轻功能、数据覆盖不足的痛点,本项目团队自主研发了世界领先的“蛋白质工程通用 AI 设计平台”,开创性地实现了“从序列直达功能”的端到端精准设计 。
本项目攻克了蛋白质设计领域的“数据孤岛”与“模型泛化”难题,形成了三大核心技术突破:
1. 构建全球最大规模蛋白质多模态数据库 VenusPod: 汇聚了深海 MEER 计划、盐湖极地微生物等独家数据,清洗整合了全球 150 亿条蛋白质序列,并包含 65 亿条带有温度、pH 等环境标签的高质量数据,为 AI 模型提供训练基石 。
2. 研发 Venus 系列蛋白质通用基础大模型: 基于 Transformer 架构训练了百亿级参数的蛋白质语言模型 VenusPLM,并衍生出 Venus-REM(定向进化)、Venus-Mine(酶挖掘)等专用模型,具备在零样本或小样本条件下精准预测蛋白质稳定性、活性及表达量的能力 。
3. 建立“干湿闭环”迭代系统: 打造了 Venus-Auto 高通量自动化湿实验平台,形成了“AI 设计-自动化合成筛选-数据回流优化”的完整闭环。该系统能将模型预测结果快速验证,并将高质量实验数据实时反哺模型,实现设计能力的持续自进化 。



过去一年间,该平台助力了几十家科研单位与企业在生物医药、体外诊断及绿色制造领域的蛋白质研发,成功设计并交付 30 余款高性能蛋白质,其中 10余款已实现规模化量产。