探索发现 · 交大智慧

上海交大何哲陟团队论文荣获DAC 2025最佳论文提名奖

近日,第62届电子设计自动化领域顶级学术会议DAC(Design Automation Conference,CCF-A类)在美国旧金山市召开,上海交通大学计算机学院何哲陟副教授团队两篇论文入选,其中一篇针对三维点云的KNN存内计算加速架构成果“PICK: An SRAM-based Processing-in-Memory Accelerator for K-Nearest-Neighbor Search in Point Clouds”荣获最佳论文提名奖。今年DAC会议总共接收1862篇论文最终录用420篇,其中仅有7篇文章被提名为最佳论文。上海交通大学计算机学院博士生聂晨为该文章的第一作者,联想蒋超、肖利明、张伟丰为合作者,计算机学院何哲陟副教授为通讯作者。该研究工作得到了国家自然科学基金、国家重点研发计划等资助。

图片1.png

研究背景

点云是一种常用于精确刻画空间结构的数据格式,已广泛应用于自动驾驶、机器人导航与增强现实等前沿应用。而在这些应用中,最常用的计算是kNN搜索算法,其主要用于处理点云中的点与点之间的几何邻接关系,是SLAM、点云配准、目标识别与语义分割等多项关键算法的底层核心。然而,kNN搜索在计算和存储方面均面临巨大挑战:其距离计算和Top-k查找操作不仅计算密集、对内存带宽要求高,甚至能够占据整个点云处理流程80%以上的总延迟。

c7dd406f5146568dce336cc67c4fdc6.png

图:点云数据示意图

尽管已有部分加速器尝试通过数据结构优化(如kd-tree、octree等)或近似计算减少负载,但往往存在精度损失或预处理开销大等问题。特别是在资源受限的边缘设备上,实现低功耗、低延迟且高精度的kNN搜索,依然是当前业界和学术界面临的关键难题与技术挑战。

研究成果

针对上述瓶颈,团队提出了一种基于SRAM的存内计算加速架构,首次实现了高效、精准、全硬件可部署的kNN点云搜索加速,文章在体系结构与电路层面进行了多项关键创新:

(1) 比特串行存内计算技术:引入成熟的基于比特串行的存内计算微架构设计,将传统kNN中的乘加操作转换为可在SRAM内部原位执行的逻辑操作,显著降低数据搬移开销,并消除了运行时对DRAM的访问,实现真正意义上的“计算即存储”,并显著优化数据局部性与复用性。

(2) 位宽裁剪技术:提出一种创新的裁剪策略,通过识别有效信息位,动态减少无关位宽,在几乎不影响精度的前提下,通常情况下可以将距离计算的逻辑操作数量降低56%,大幅缩短延迟并降低能耗。

图片2.png

图:比特裁剪算法可以大幅减少计算量

(3) 基于筛选与选择的Top-k查找机制:为支持任意k值的高效查找,设计了“筛选-选择”两阶段机制,结合动态阈值二分调整,实现了Top-k查找的近似常数时延处理,突破了现有方案对k值不敏感或资源利用率低的限制。

图片1.png

图:基于筛选与选择的高效Top-k查找机制

(4) 两级流水线结构设计:实现距离计算与Top-k查找的硬件流水并行,加速整个查询流程,有效提升吞吐率。

实测结果表明,PICK在多个真实点云数据集上均表现出优异性能:在KITTI数据集上,相较于现有最佳设计BitNN,PICK实现了4.17×运行速度提升与4.42×能耗降低,同时保持几乎无精度损失。该架构支持大规模点云处理任务的全片上部署,具备广泛的边缘计算落地潜力。

8c868a1f091f539ba70f582b80e87db.png

图:精度测试证明该工作可以保证良好的精度

图片4.png

图:性能评估表明该设计的性能远超现有其他设计

主要作者介绍

聂晨是上海交通大学计算机学院的博士生,主要研究方向为高性能计算架构、存内计算架构设计、软硬件协同设计与优化,发表论文Nature Communication, TC, DAC等。

何哲陟是上海交通大学计算机学院的副教授,主要研究方向为智能计算软硬件设计、类脑计算、计算机体系结构、电子设计自动化等。

聂晨
计算机学院(网络空间安全学院、密码学院)