综合新闻
电院优秀毕业生谢知晖:他那滚烫赤诚的“狂想”,让科幻走进现实
他是热爱科幻的人工智能领域青年学者,也是勇于突破自我的“科研战士”。他用持之以恒的努力,滴水穿石,硕果累累,在漫漫科研宇宙中留下属于自己的印迹。他就是电子信息与电气工程学院2024届优秀硕士毕业生谢知晖。
以机器学习探索智能边界
受科幻巨作《银翼杀手》的启发,谢知晖在高中时期就对机器学习产生了浓厚的兴趣。电影中仿生人眼中的宇宙壮丽景象——战舰在猎户星座边缘的熊熊火光、C射线在唐怀瑟之门外的神秘闪烁,这些超现实的画面引发了他对智能极限和生命本质的深刻思考。自此,他立志投身机器学习研究,探索这一领域的无尽奥秘。
谢知晖在硕士毕设答辩现场
谢知晖积极投身于将序列决策智能技术应用到现实场景的研究中,开发高效且通用的机器学习方法。他创新性地从生成式模型的角度出发,巧妙地将复杂的序列决策问题统一为序列生成问题。
序列决策场景下的预训练技术
现实世界的序列决策问题复杂且多变,但其背后往往有大量的历史数据和经验可以被挖掘和学习。这启发了谢知晖探索预训练技术在序列决策问题中的应用。为了更好地研究该问题,谢知晖系统性地整理了现有的预训练方法,并敏锐地观察到现有方法对人工标注数据的依赖。基于此,他提出了高效的无监督预训练方法,充分利用生成式模型在无监督学习方面的强大能力,为该领域朝着更大规模的预训练模式发展贡献了力量。他凭借这些研究成果,研究生期间在ICML、EMNLP、SIGIR等国际顶级学术会议上共发表高水平论文6篇。
昼夜奋战,攻坚克难
每一项科研成果取得的背后是谢知晖无数次白天黑夜地埋头苦干、反复揣摩。他依然清晰地记得,在研究生一年级组会上,面对导师李帅的“灵魂发问”:“你最近有什么进展?” 当时他给出的只是一堆空洞的数据。在李帅的引导下,谢知晖开始学会从反馈中学习,不断优化自己的研究方法。他逐渐意识到,机器学习远非算法和数据的堆砌,更是一种深层次的思维方式,用于解决实际问题。
每一次科研讨论,李帅老师都鼓励我畅所欲言,哪怕是最初步、最不成熟的想法也会得到重视。“怎么获取反馈并从反馈中学习”,是李帅老师给予我受益终身的研究课题。
谢知晖(左一)与导师李帅合影
在研究过程中,谢知晖面临的比较大的困难,是无监督预训练方法的不稳定性。在没有明确的标注信息指导下,模型学习到的特征往往难以捕捉到与目标任务紧密相关的决策因素,导致预训练过程中模型表现的波动性大,难以稳定提升。谢知晖回忆道,“这个过程对我锻炼很大,我投入了大量的时间和精力,不断尝试和调整不同的模型架构和学习算法。” 最后他将后继特征理论应用于无监督预训练,不仅克服了无监督预训练的不稳定性难题,还为模型学习提供了一种新的方法论框架。
谢知晖在国际分布式人工智能学术会议(DAI 2022)上作学术报告
正是凭借着这份坚韧不拔的耐性和对科研的热爱,谢知晖在近七年的时间里不断取得突破。他的足迹遍布实验室、食堂和宿舍,这三点一线的生活轨迹也见证了他对序列决策智能研究的执着追求和不懈努力。
知行合一,勇于创新
科研探索的道路上,谢知晖始终站在行业前沿,他不仅深入研究学术理论,更重视将研究与实际应用紧密结合,将理论付诸于实践。
在参与腾讯犀牛鸟精英人才计划时,他深入洞察了游戏AI领域的难点与挑战,并紧密围绕行业实际面临的问题展开深入思考,推动了多项创新科研工作的完成。谢知晖坚信,科研工作不应是脱离实际的空中楼阁,而应基于现实问题的假设和前提,力求做出更具普适性的研究。凭借这种理念,他在该计划中脱颖而出,荣获腾讯犀牛鸟精英人才计划优秀学生奖。
谢知晖2022年腾讯犀牛鸟精英人才计划优秀学生奖证书和奖杯
在与华为公司的合作项目中,谢知晖创新性地应用了序列决策模型,显著优化了SAT求解器的性能。这一成果不仅在国际SAT竞赛并行赛道上为谢知晖赢得了铜牌荣誉,更荣获了华为颁发的火花奖。
谢知晖国际SAT竞赛并行赛道奖牌
在上海交通大学七载的求学时光里,谢知晖潜心钻研机器学习的深邃奥秘。毕业在即,他又踏上了前往香港大学的学术征途,专注于交互式决策智能的探索。
上海市优秀毕业生的殊荣,对谢知晖来说,不仅是对他硕士研究生阶段努力的肯定,更是他未来科研道路上的崭新起点。他立志继续挖掘决策智能的“未至之境”,勇往直前,探索更为广阔的科研天地。
姓名:谢知晖
院系:电院约翰·霍普克罗夫特计算机科学中心
硕士导师:李帅
曾获荣誉:2024年上海市优秀毕业生,2021年、2023年研究生国家奖学金,2022年腾讯犀牛鸟精英人才计划优秀学生奖
毕业去向:香港大学