综合新闻

凯原法学院学术午间课堂第十讲举行

2022年6月12日,凯原法学院举办了学术午间课堂第十讲。课堂邀请上海交通大学凯原法学院教授、副院长杨力进行授课。讲座开始,杨力提出一个问题:“如何把法学问题转化为数字问题”。并以法国画家塞尚的作品《圣维克多山》为引说明数字化思维与传统法律思维的区别。

image.png

首先,杨力指出信息是“较低熵”的数据,知识是“经过凝练”的信息。从数据到信息是一个去熵化的过程。所有的社会关系连接以后会形成知识图谱。通过知识图谱,原始文本数据的学习,获得知识在低维稠密空间的分布向量,更好表达实体、关系及其之间的复杂语义关联,实现异质信息融合。关于形成知识图谱的过程:第一,在两个词之间进行夹角关联是传统的知识表示方式,而以GPT为代表的新技术不一样,仅需关键词就可对自动生成的大量数据整合成诸多选项;第二,通过识别实体、实体链接构建知识库;第三,从给定的知识图谱推导出新的实体与实体关系;第四,以智能搜索、自动问答等形式进行知识应用。

接着杨力以“切实解决执行难”为例,提出加强综合治理从源头切实解决执行难,主要有三个问题作为切入点:人财查控难,需要轨迹分析和财产挖掘能力;委托处理难,需要动态推荐和违规预警能力;过程管理难,需要移动执行与智能管控能力。这些问题最终指向了人机混合协同推理与法律领域知识学习相结合。而执行难解决后,要通过“电子卷宗全流程无纸化且随案同步生成与深度应用”进行串联。

随后杨力介绍了词嵌入技术,并指出词嵌入技术无法解决理解关联上下文的问题,因此需要借助基础性神经结构建立联系。在深度学习中,需通过预训练在大规模无标注数据上进行自监督学习,但不同人打标注的能力不同,BERT/GPT可以帮助进行进一步调整。预训练的微调依然存在诸多的不足,由此人类反馈的强化学习这一全新的训练范式诞生,将LLM响应与人类反馈进行对齐。

虽然大数据模型已经具备了一定的多模态代码生成能力,但由于训练集和提问方式潜存的问题,大数据可能生成看似正确实则错误的回答来误导公众。最后,杨力通过建设背景、研究领域、核心要素等方面介绍了上海交通大学智慧司法实验室建设以及目前主要研究的五个具体方向。

凯原法学院
凯原法学院
张宸溪