上海交大义理林课题组基于灰盒神经网络实现大容量长距离光纤通信实验系统数字孪生_交大智慧

探索发现 · 交大智慧

上海交大义理林课题组基于灰盒神经网络实现大容量长距离光纤通信实验系统数字孪生

2024年07月04日责任编辑：万凤箫孙佳

近日，上海交通大学电子信息与电气工程学院电子工程系义理林教授课题组（LIFE，Laboratory of intelligent fiber ecosystem）提出了联合物理模型与AI模型的光纤通信实验系统数字孪生（digital twin，DT）方案，通过数字信号处理进行特征分离与关键参数提取，首次从大容量长距离（30.5Tb/s 1200km）光纤通信系统实验数据中提取信号特征，对实验特征进行快速准确的数字孪生。相比实验系统，DT建模的Q因子误差在0.1dB以内，相比于传统的分步傅里叶建模方法实现1200倍速率提升。相关成果以“The digital twin framework for the physical wideband and long-haul optical fiber communication systems”为题于2024年6月发表于国际光学期刊《Laser & Photonics Reviews》。

研究背景

随着光通信达到其频谱效率的极限，超宽带传输正在被采用，以进一步推动光纤容量的提升。然而，用于超宽带和长途光传输的实验系统非常昂贵，价格高达数百万美元。此外，系统建设需要大量的经验和调试，从而会降低研究效率。DT技术作为一种与实验系统特征对齐的仿真工具，可以降低研究门槛并提高科研效率。DT模型还可以提供各种物理信道信息，实现传输性能预测、系统和信号优化、故障管理、算法快速验证等，在光通信的物理层和网络层具有广泛应用的巨大潜力。

传统的光纤信道建模方案：分步傅里叶方法（SSFM），其复杂度至少是带宽的四次方，因此无法很好地扩展到更宽带的传输场景，另一方面，当链路参数（如衰减、色散、非线性因子等）与波长相关且未知时，没有明确的技术来校准SSFM，这不可避免地导致结果偏差。另一种建模方案：数据驱动模型，其不依赖于系统参数，通过足够的训练数据，可以实现快速、准确的光纤信道建模。然而，由于系统中复杂的时变随机效应，使数据驱动方法难以直接应用于实验系统。即使神经网络被输入了大量的信道参数和数据，由于神经网络的规模很大，仍然很难成功建模。截至本工作前，还没有可靠的方法能够实现光通信实验系统的数字孪生。

研究路径：灰盒神经网络数字孪生架构

图1 光纤通信系统的数字孪生框架。CDC：色散补偿，MIMO：多输入多输出，FOE：频偏估计，CPE：载波相位恢复，PN：相位噪声，PMD：偏振模色散

信号在光纤通信系统传播过程中可能容易受到各种设备和光纤引起的复杂而多样的系统干扰，包括线性效应、非线性效应、随机噪声和时变随机效应，对复杂特征进行完整建模是一项挑战。值得庆幸的是，随着光通信中数字信号处理（Digital Signal Processing, DSP）的发展，特定类型的干扰已被广泛研究，特别是线性类型的干扰。这激发了研究团队灵活利用成熟DSP算法来分离系统特征和实时跟踪参数的想法。一方面，通过DSP进行特征分离后，时变效应被消除，信道特征得到简化，可以采用基于数据驱动的方案直接从实验数据进行实验系统建模；另一方面，实时的参数跟踪保证了DT模型与实验系统保持一致。因此研究人员提出了光纤通信系统的DT架构，如图1所示，该框架包括三个主要模块：数据预处理、确定性随机神经网络和物理模型，每一模块在整个系统中都发挥着至关重要的作用。

在数据预处理模块中，首先在物理实验系统中采集各种条件下的信道输入输出数据，然后使用传统的线性DSP对输出数据进行线性和时变特征补偿，以此实现特征分离，并简化神经网络模型的建模目标。此外，DSP估计的参数可以被馈送到物理模型中，以实现物理环境参数的对齐。

数据预处理补偿后的剩余特征包括未补偿完的线性、非线性和随机噪声，可分为确定性特征和随机性特征。根据需要建模的目标特征类型，团队设计了一种确定随机神经网络（Deterministic-random neural network，DRNN）结构来捕获光纤的确定性非线性特征以及其他波段的随机干扰，这些干扰被认为是扰动，可被建模为“集总”随机噪声。其中与时间记忆有关的非线性确定特征采用双向长短记忆网络（Bi-directional Long Short-Term Memory，BiLSTM）建模，随机性特征采用生成对抗网络（Generative adversarial network，GAN）进行随机特征建模。在两种模型的双并行模式下，可以同时获得系统的确定性和随机特征。

DRNN只对DSP后保留的非解析和随机性特征进行建模，为了形成一个完整的DT系统，已被DSP补偿的特征也应该被建模。被补偿特征可以看作是线性效应，可以用链路单元的物理模型来描述，物理模型可视为收端DSP的逆过程，过程包括上采样、激光器引入的相位噪声与频率偏移、色散与偏振膜色散。

最后，完整的信道特征可通过数据驱动和物理驱动的混合模型获得，这种混合方式构成了基于灰盒神经网络的DT架构，可以实现系统多个元素的灵活组合。通过这种DT架构，用户可以获得任何节点的输出数据，物理模型的参数可以从DSP获得或由用户自定义。

研究成果

图2 Exp-DSP输出和DRNN输出星座图。（a）WDM传输的CUT结果，蓝色直方图和包络表示同相支路信号的强度分布；（b）单通道传输的强非线性结果，T1:3万训练符号，T2:15万训练符号

为了理解由BiLSTM和GAN建模的确定特征和随机特征，研究人员展示了DRNN输出信号的星座图。图2（a）为WDM传输的CUT结果，其中MI为2.75，发射功率为4.0dBm，传输光纤长度为1200km。作为更具体的比较，研究团队还用蓝色直方图和包络绘制了I路信号的强度分布。实验数据DSP处理后（Exp-DSP）输出和DRNN模型输出在星座图和直方图上都非常相似。BiLSTM的输出与幅值相关的数据分布符合PCS原理，即幅值小的符号概率高，幅值大的符号概率低，结果证明，BiLSTM输出可以显示不同的整型程度。第五列是GAN的目标数据，目标数据符合高斯分布。第四列是GAN输出，也是一个满足高斯分布的随机噪声。GAN生成数据与目标数据的方差分别为0.44和0.439，两个数据的平均值都是0，表明生成的数据和目标数据之间的差异非常小。

图2（b）展示了一个强非线性的信道条件，直观地验证了BiLSTM模型的非线性建模能力。信道数为1，MI为4.0，发射功率为3.0dBm，传输长度为400km。第一列的Exp-DSP数据具有明显的与信号幅值相关的明显非线性相位旋转，我们使用BiLSTM模型来捕捉非线性特征，即自相位调制。当训练数据为3万时，BiLSTM模型输出与Exp-DSP输出之间有较大差距，DRNN的输出更接近高斯分布，而不是非线性特征。研究团队将训练符号的数量增加到15万，然后BiLSTM模型成功学习到了非线性效应，这反映在星座图中与振幅相关的相位旋转，且DRNN输出的星座图特征与exp-DSP的输出星座图的特征相似。结果证明了BiLSTM模型对非线性特征建模能力，也验证了较大的训练数据量可以获得更高的建模精度。

图3 完整DT系统的结果。（a）在相同的Rx DSP过程中，实验输出和DT输出的星座图的变化过程；（b）Q和SNR与Exp-DSP输出和DT-DSP输出的距离的关系；（c）DRNN和物理模型的运行时间

研究团队测试了具有完整信道效应的DT输出的精度，结果用星座图和系统性能来展示。团队使用相同的Rx DSP来补偿实验系统和DT系统产生的信号，图3(a)显示了每个DSP步骤输出的星座。在Rx DSP的过程中，包括CDC、MIMO、FOE和CPE，两个系统的星座特性几乎相同，这表明了DT系统对不同种信道特征建模的准确性。为了定量地呈现精度，研究人员还在图3(b)中记录了不同距离下DT-DSP和Exp-DSP的Q因子和信噪比。Q因子的平均误差仅为0.054dB，SNR平均误差为0.075dB。图3(c)记录了DT过程在不同距离的运行时间，通信符号数为131072。DRNN模型的复杂度与距离无关，因此，DRNN的运行时间保持在一个统一的水平，在RTX3090硬件条件下测试，它们都在1.3s以下。随着距离的增加，由于SSFM的步数增加，物理模型的建模时间也会逐渐增加，在40通道30.5Tb/s容量1200km的传输中，DT的运行时间仅为6s, SSFM的运行时间为7280s，实现了超过1200倍的效率提升。

论文信息

上海交通大学电子信息与电气工程学院电子工程系博士研究生杨航、牛泽坤为论文的共同第一作者，义理林教授为论文的通讯作者。

从左到右：杨航、牛泽坤、义理林

LIFE课题组一直致力于光纤通信系统的算法设计、系统架构设计以及智能化发展。目前，课题组深入研究基于人工智能方法的光纤信道建模、星座整形设计、非线性补偿算法以及端到端性能全局优化工作，开发基于Python的光纤通信系统智能仿真平台并开源（ifibertrans.sjtu.edu.cn），为光传输领域持续发展贡献力量。该方向工作得到国家自然科学基金项目、科技部重点研发计划、上海交通大学“交大2030”计划以及上海交通大学-华为先进光技术联合实验室的支持。

论文链接：https://onlinelibrary.wiley.com/doi/full/10.1002/lpor.202400234

作者：

电子信息与电气工程学院

供稿单位：

电子信息与电气工程学院