“大模型”落地表现为何不敌“小模型”_媒体聚焦

媒体聚焦

“大模型”落地表现为何不敌“小模型”

2024年01月15日责任编辑：谢孟希

文汇报

以ChatGPT为代表，人工智能大模型在全球科技界火到发烫，备受千行百业的关注。但从应用层面来看，当前的“用户反馈”其实并不理想。甚至，有企业代表直言，通用语言大模型的表现还不如专用小模型，其应用的可靠性也被打上问号。

日前在上海交通大学安泰经管学院举办的“AI大模型与物流供应链未来应用高层论坛”上，多位来自业界和高校的学者围绕这一话题展开热议。有专家直言，对通用大模型的产业化要有一个理性判断。决定大模型发展的关键是，要把通用的智能，包括其具备的知识获取能力、推理能力、基本理解能力、工具使用能力与专业领域的知识进一步结合，从而真正为行业和社会创造价值。

在各行各业资格考试中屡屡取得高分的通用大模型，却在实际应用中显得“高分低能”？对此，学界给出的回答是：通用大模型在落地应用阶段，目前存在一些缺陷。

清华大学长聘教授陶建华注意到，大模型已开始涉足互联网、媒体、医疗、金融等多个应用领域，但目前依然存在输出结果可信性不足、稳定性不强等关键问题。同时，大模型的安全性也面临着诸多挑战。

除了技术层面的问题，在上海交通大学特聘教授、思必驰联合创始人俞凯看来，通用大模型与行业的具体应用场景如何有效对接，也是当前的一大瓶颈难题。比如，大模型技术在应用过程中，尚难以包含私域知识。也就是说，训练大模型时所用到的数据，都是互联网上的公开信息，而无法直接获取各个行业、公司内部的文档。这就导致大模型不具备专门领域的知识，无法作出精确的判断。

如何解决大模型与真实应用场景之间的鸿沟、加速其在各行业的落地应用？多位与会专家指出，当务之急是要让通用大模型成为基础的“操作系统”，通过交叉创新，进一步构建真正适用于产业的行业大模型。

目前，国内多家行业头部企业已推出高性能的计算基础设施和平台，如阿里云百炼、腾讯云的“底座+TI平台+MaaS”、华为云盘古大模型等。在此基础上，针对行业应用的具体需求，专家认为，要进一步通过应用范式创新，释放智能生产力。

“大模型不仅仅是一种生产工具，更是企业的‘合作者’，将为企业注入无限生成动能。”上海交通大学特聘教授江志斌建议，为满足广泛的市场需求，要实现基础模型底座的标准化开发和泛在化应用，就应进一步鼓励、支持开发者有条件地采集私有数据，完成对通用大模型的个性化微调。应进一步推动产学研用深度融合，突破数据质量、隐私保护等瓶颈问题，推动行业大模型的发展。

展望未来，也有不少产业界人士预测，大模型的应用将实现从智能化向智能体的跨越。俞凯认为，具备通用人工智能的语言大模型智能体，将是大模型产业应用的一大发展方向。而要实现这一点，大模型在产业落地的过程中，必须做到技术联动。对大模型来说，学习的过程就是消耗语料和数据的过程，光有语料是不够的，还必须能够连接各种各样的模态、设备甚至小模型。所以，未来的智能体既具备智力，又具备行动能力和任务规划能力，同时还能和人以及其他智能体进行交互。

文：储舒婷

图：文汇报资料图

编辑：吴金娇

责任编辑：樊丽萍

媒体链接

“大模型”落地表现为何不敌“小模型”