探索发现 · 交大智慧

上海交大郭旭涵、苏翼凯团队在高计算密度散射介质任务推理光芯片取得重要进展

随着机器学习推理任务在多个领域的广泛应用,巨大的算力需求与能耗问题日益凸显。利用电磁波在介质传播过程中的低损耗特性,通过设计介质结构进行光学模拟计算,展现出降低功耗、提升计算带宽的潜力。尤其在边缘计算场景中,机器学习推理任务对实时性和能效要求极高。光学模拟计算尽管精度相对较低,但其高速计算特性与当前边缘计算设备中通过高度量化提升推理速度的思路不谋而合。基于这一背景,研究团队提出了一种集成散射介质的设计方法,有效降低了加工难度并提升了结构稳定性,进而在芯片上通过智能设计的介质超结构实现了高效的机器学习光学推理。

近期,上海交通大学集成电路学院(信息与电子工程学院)郭旭涵教授、苏翼凯教授课题组与上海理工大学顾敏院士课题组在SOI(Silicon on Insulator, 绝缘衬底上的硅)平台上成功实现了基于散射介质的机器学习任务推理。研究团队在8μm×8μm的设计区域内,实现了最小特征尺寸为130nm(可通过90nm工艺的版图设计规则检验)的集成散射介质结构,并完成了鸢尾花分类任务的实验验证。此外,该设计方法具有良好的扩展性,可适用于更复杂的任务场景。研究团队通过仿真验证,在44.8μm×44.8μm的设计区域内实现了8×8图像分辨率的手写数字识别任务,识别准确率达到92.8%,进一步证明了集成散射介质在机器学习推理方面的应用潜力。相关成果以“High computational density nanophotonic media for machine learning inference”(高计算密度纳米光子学介质用于机器学习推理)为题发表于《Nature Communications》。

1.png

研究背景

尽管模拟计算存在精度较低、抗干扰能力偏弱等不足,在过去数十年间并未成为计算系统的主流。然而,随着人工智能技术的飞速发展,如何在推理速度、能耗与准确率之间取得最佳平衡,已成为业界关注的焦点。在这一背景下,光学模拟计算作为一种有望重塑未来计算范式的新路径,近年来受到广泛关注。与基于分立光学元件的系统相比,在集成光电芯片上实现光学模拟计算,具有集成度高、稳定性好等显著优势。但值得注意的是,即便是集成芯片方案,若其设计仍拘泥于传统的集成光学器件,也较难突破集成度的瓶颈,从而难以胜任大规模复杂任务。为此,研究团队引入“逆向设计”方法——该方法几乎不受传统设计经验束缚,直接基于麦克斯韦方程组对器件结构进行优化设计,有望为边缘计算场景量身打造高计算密度、低功耗的专用推理器件。

创新成果

2.png

图1 基于集成散射介质的机器学习推理器件

研究团队基于伴随法通过求解麦克斯韦方程数值解获取训练任务损失函数对于阵列结构参数的梯度,并结合加工规则约束,实现对散射介质结构的智能化设计。如图1所示,经过智能化设计后的器件,能够对多个输入光波导中传播光波的相位信息进行高效处理,并将运算结果直接映射到输出波导的光波强度上。通过比较不同输出波导的光强,即可获取推理结果。输入信息的加载,则可通过片上集成的移相器便捷实现,进一步提升了系统的集成度与可控性。

3.png

图2 不同测试样本在推理过程中的仿真电磁场坡印廷矢量x方向分量分布 :(a)类别1的样本,(b)类别2的样本,(c)类别3的版本

在器件设计过程中,研究团队采用时域有限差分方法进行数值仿真。通过设置伴随仿真,计算出损失函数对器件结构参数的梯度,并在每次迭代中引入加工设计规则约束,确保最终结构具备良好的可加工性。图2展示了不同测试样本在推理过程中的仿真电磁场坡印廷矢量x方向分量分布,直观呈现了携带不同样本信息的光波在推理过程中的能量分布特性。

4.png

图3 实验验证:(a)实验方案图,(b)器件光学显微镜照片,(c)器件扫描隧道显微镜照片,(d)实验混淆矩阵

研究团队进一步对面向鸢尾花分类任务所设计的器件进行了微纳加工与实验测试(图3),实现了86.7%的测试准确率。实验中,不同样本的特征信息通过片上集成的热调移相器进行加载,输出光信号则由光电探测器采集并转换为推理结果。团队还测试了器件在一定带宽范围内的性能表现,结果间接表明其在更高频率输入环境下具备应用潜力。未来采用电调移相器等方案加载输入信息,将有望实现超低延迟的推理能力。

5.png

图4 手写数字识别任务仿真验证:(a)器件结构及任务描述,(b)仿真混淆矩阵,(c)准确率及损失变化图

为验证该方法的可扩展性,研究团队进一步使用包含64个像素的手写数字数据集,开展了更大规模的设计仿真(图4)。在44.8μm×44.8μm的设计区域内,仿真实现了92.8%的识别准确率。随着未来仿真与实验条件的进一步完善,该方法有望在更复杂、规模更大的推理任务中获得实验验证与应用。

论文信息

上海交通大学集成电路学院(信息与电子工程学院)博士生赵振宇为第一作者。通讯作者为上海交通大学集成电路学院(信息与电子工程学院)郭旭涵教授和上海理工大学方心远研究员。该工作得到了上海交通大学集成电路学院(信息与电子工程学院)苏翼凯教授和上海理工大学顾敏院士的大力支持和指导。上海交通大学潘亦晨硕士、向金龙博士后、张钰嘉讲师、何安助理教授、赵耀天助理研究员、博士生陈有略、何宇助理研究员也为本工作做出了重要贡献。同时,该工作得到了国家重点研发计划、国家自然科学基金和上海市科委等项目支持,以及得到光子传输与通信全国重点实验室、上海交通大学先进电子材料与器件平台(AEMD平台)的测试加工支持。

01.jpg

郭旭涵

论文通讯作者郭旭涵教授主要研究光电子集成芯片,入选国家级高层次青年人才,获得中国光学工程学会三年“硅基光电子优秀成果奖”(2024)。近五年以一作/通讯作者发表高水平论文30余篇,包括 Nature Photonics,Nature Communications,eLight, Light: Science & Applications, Laser & Photonics Reviews, Optica等。邀请报告25余次,包括光学顶会OFC, IPC, APC等。主持国家重点研发计划课题1项,国家自然科学基金2项,上海市科委项目2项等。担任国际知名期刊APL Photonics编委,IEEE Journal of Quantum Electronics编委,光学知名会议OECC TPC共主席, ACP Workshop共主席等。

02.jpg

苏翼凯

苏翼凯教授领导的光传输与集成光子学实验室(OTIP)立足光电子研究领域的前沿,主要研究高速光通信系统与各类集成器件,重点研究应用于传输及交换领域的硅基及异质集成光电子芯片。

论文链接https://www.nature.com/articles/s41467-025-65213-0

集成电路学院(信息与电子工程学院)
集成电路学院(信息与电子工程学院)