综合新闻

致远学院2021级ACM班胡珂雅所在团队荣获ARC Prize2024最佳论文奖

ARC Prize 2024是一项全球性的公开竞赛,旨在激励研究人员攻克ARC-AGI基准测试,以推动通用人工智能(AGI)的发展,悬赏共计100万美金。ARC-AGI(Abstraction and Reasoning Corpus for Artificial General Intelligence)是由François Chollet于2019年发布的基准测试集,旨在评估AI系统在面对全新任务时的抽象推理和泛化能力。

1.png

胡珂雅所在团队获评最佳论文奖

ARC Prize 2024共吸引1430支团队提交了17789份作品,尽管年度大奖无人问鼎,但比赛期间,ARC-AGI 私有评估集的最高得分从33%提升至55.5%,显示了显著的进步,接近人类在验证集上60%准确率的平均水平。比赛根据准确性、泛化性、进步性、理论性、复杂性和创新性评选论文进行颁奖,其中上海交通大学致远学院2021级计算机科学方向(ACM班)胡珂雅所在的康奈尔团队获得了最佳论文奖,赢得了5万美元奖金。

成果简介

2.png

Few-shot learning tasks from the Abstraction and Reasoning Corpus (ARC). Each task is a visual puzzle game,  typically has 2-5 input-output examples.

该论文通过搭建使用 LLM (大语言模型)和 DSL(领域特定语言) 自动生成新的形似ARC任务的合成数据集的流水线,合成新的可以生成输入图像,将输入图像遵循特定规律转化为输出图像的程序。接着,在这个合成的新数据集上训练大语言模型。

3.png

Induction generates an intermediate function f to explain training input-outputs. Transduction directly predicts the test output, for example using a neural network.

论文通过模仿人类进行详细推理和根据直觉给出答案,设计了两种不同的训练方法:通过训练神经模型来进行 induction(进行推理导出潜在的函数程序)和 transduction(直接预测给定测试输入的测试输出)来解决ARC问题。研究发现,尽管 induction 和 transduction 模型使用相同的数据集进行训练,并共享相同的神经网络架构,它们在测试问题上的表现却存在差异:induction 在精确计算和组合多个概念方面表现出色,而 transduction 在处理较模糊的感知概念时更具优势。将两者结合,可以在 ARC 任务上取得接近人类水平的表现。

这篇论文由胡珂雅同学和来自康奈尔大学的博士生Wen-Ding Li共同带领完成,互为共同一作,这篇论文同时在ICLR(International Conference on Learning Representations)世界机器学习顶会上被录取。

科研历程

微信图片_20250325154653.jpg

2023年9月起,胡珂雅师从上海交通大学仿脑计算与机器智能研究中心郑伟龙副教授,开展提升自监督方法对于时序信号任务的表现相关研究。2024年7月至12月,在致远学院的资助下,胡珂雅前往康奈尔大学访问,在教授Kevin Ellis、博士生Hao Tang的指导下开展科研实习活动,攻坚ARC难题。在此期间,郑伟龙老师也积极参与了这个项目,在组会上提出许多宝贵的意见。

作为计算机零基础的学生,致远学院和ACM班给了胡珂雅非常大的支持,来自老师和助教们的帮助带领她一步步打开计算机科研世界的大门,喜欢上计算机这个学科。班级的授课体系和培养方案更是鼓励同学们自由拓展发展自己对不同科研方向的兴趣,支持同学们出国交换,拓展眼界,认识更多来自世界各地对计算机科研有着热情的人们。

师长寄语

俞勇.jpg

ACM班项目主任俞勇老师表示,“印象中,珂雅进大学以来一直很从容,尤其对一名竞赛零基础的学生来说,确实难得。这个得益于珂雅的良好习惯,她总是未雨绸缪,是一个计划性很强,而且执行力也很强的‘倔’人,也是一个非达到目的不可的‘拗’人。四年来,看着她的进步,到今天所取得的成绩,由衷为她高兴和自豪。但这又是新里程的起点,祝珂雅在计算机科学的道路上一路奔跑,勇往直前!”

上海交通大学ACM班于2002年成立,2011年作为“基础学科拔尖学生培养计划”中的计算机科学班纳入致远学院。二十余年来,ACM班已培养出700余名毕业生,包括许多计算机科学和人工智能领域的优秀人才,比如斯坦福大学助理教授杨笛一,卡耐基梅隆大学助理教授xgboost作者、tvm 发起人陈天奇,加州大学圣地亚哥分校助理教授商静波,南加州大学助理教授张家鹏,南京大学教授林冰凯,依图科技联合创始人林晨曦,第四范式创始人&ceo戴文渊,英语流利说cto胡哲人,锐战网络创始人&ceo赵中毅,触宝科技cdo任腾,饿了么高级副总裁罗宇龙,森亿科技创始人&ceo张少典,墨奇科技cto汤林鹏,前亚马逊首席科学家、“教你动手学深度学习”的李沐等等,这批公司整体估值已超过千亿元。

致远学院
致远学院
孙殷彤
钱露