媒体聚焦

“大模型”落地表现为何不敌“小模型”

以ChatGPT为代表,人工智能大模型在全球科技界火到发烫,备受千行百业的关注。但从应用层面来看,当前的“用户反馈”其实并不理想。甚至,有企业代表直言,通用语言大模型的表现还不如专用小模型,其应用的可靠性也被打上问号。

eac33338f1fd489f8b0f5a99b5421bc3.jpg

日前在上海交通大学安泰经管学院举办的“AI大模型与物流供应链未来应用高层论坛”上,多位来自业界和高校的学者围绕这一话题展开热议。有专家直言,对通用大模型的产业化要有一个理性判断。决定大模型发展的关键是,要把通用的智能,包括其具备的知识获取能力、推理能力、基本理解能力、工具使用能力与专业领域的知识进一步结合,从而真正为行业和社会创造价值。

在各行各业资格考试中屡屡取得高分的通用大模型,却在实际应用中显得“高分低能”?对此,学界给出的回答是:通用大模型在落地应用阶段,目前存在一些缺陷。

清华大学长聘教授陶建华注意到,大模型已开始涉足互联网、媒体、医疗、金融等多个应用领域,但目前依然存在输出结果可信性不足、稳定性不强等关键问题。同时,大模型的安全性也面临着诸多挑战。

除了技术层面的问题,在上海交通大学特聘教授、思必驰联合创始人俞凯看来,通用大模型与行业的具体应用场景如何有效对接,也是当前的一大瓶颈难题。比如,大模型技术在应用过程中,尚难以包含私域知识。也就是说,训练大模型时所用到的数据,都是互联网上的公开信息,而无法直接获取各个行业、公司内部的文档。这就导致大模型不具备专门领域的知识,无法作出精确的判断。

如何解决大模型与真实应用场景之间的鸿沟、加速其在各行业的落地应用?多位与会专家指出,当务之急是要让通用大模型成为基础的“操作系统”,通过交叉创新,进一步构建真正适用于产业的行业大模型。

目前,国内多家行业头部企业已推出高性能的计算基础设施和平台,如阿里云百炼、腾讯云的“底座+TI平台+MaaS”、华为云盘古大模型等。在此基础上,针对行业应用的具体需求,专家认为,要进一步通过应用范式创新,释放智能生产力。

“大模型不仅仅是一种生产工具,更是企业的‘合作者’,将为企业注入无限生成动能。”上海交通大学特聘教授江志斌建议,为满足广泛的市场需求,要实现基础模型底座的标准化开发和泛在化应用,就应进一步鼓励、支持开发者有条件地采集私有数据,完成对通用大模型的个性化微调。应进一步推动产学研用深度融合,突破数据质量、隐私保护等瓶颈问题,推动行业大模型的发展。

展望未来,也有不少产业界人士预测,大模型的应用将实现从智能化向智能体的跨越。俞凯认为,具备通用人工智能的语言大模型智能体,将是大模型产业应用的一大发展方向。而要实现这一点,大模型在产业落地的过程中,必须做到技术联动。对大模型来说,学习的过程就是消耗语料和数据的过程,光有语料是不够的,还必须能够连接各种各样的模态、设备甚至小模型。所以,未来的智能体既具备智力,又具备行动能力和任务规划能力,同时还能和人以及其他智能体进行交互。


文:储舒婷

图:文汇报资料图

编辑:吴金娇

责任编辑:樊丽萍