媒体聚焦

上海交大过敏意教授团队:用云计算应对超千倍的用户请求“峰值突变”

央广网报道战疫之初,各大社交平台上与疫情相关的词条、帖子等搜索和浏览量急剧上升,一时间用户请求剧增,各大运营商的服务器倍感“压力山大”。在互联网服务中,这种相邻单位时间内终端用户请求量显著增长的现象被称为“突变峰值”。生活中,突变峰值现象广泛存在,如“双十一”购物节,除夕夜“微信抢红包”,以及“春运抢票”等等。这些基于云计算的新兴互联网服务,在峰值突变时容易出现用户请求响应慢、系统崩溃等情况,使得用户的需求得不到及时满足。

突变型峰值服务的出现,在服务的持续可靠提供、服务质量的严格保证、运营的低成本等方面对云计算提出了新的需求, 带来了构建强实时、高吞吐、快扩展、高鲁棒云计算系统的技术难题。以2014年阿里云为例:传统云计算面向通用弹性计算设计,在处理突变型峰值服务时存在延迟长、吞吐低、扩展慢、运维难等问题。自2008年起,上海交通大学过敏意教授团队与阿里云合作,历经十余年攻关,研发了支持突变型峰值服务的云计算系统 SPS(Sprinting Peak Service),包含请求调度、阵列优化、资源扩展、异常监控等功能组件。该项目的诞生,在很大程度上摆脱了以往“服务器不够用”的窘境。如今,这项技术在工博会上亮相,受到专业观众的青睐。

突变峰值用户请求快速处理技术:支持全球最大规模电商业务

SPS系统在突变峰值时的自动负载均衡及访存优化方面取得了突破。用户请求处理速度慢仍是突变峰值时保证用户请求低延迟响应的主要瓶颈,其根源在于频繁远程内存访问、内存功耗自动降级、异构硬件负载不均衡。为此,过敏意团队“对症下药”,在数据本地化、内存数据优化放置及内存功耗管理、自动负载均衡等方面发明了基于数据本地化计算的请求调度技术、基于访问热度的访存加速技术、基于工作量精确预测的负载均衡技术。将上述技术融合、落地,应用于天猫“双十一”的技术支持,不仅满足了49.2万单/秒的请求处理需求,还将峰值时用户请求尾时延从分钟级降低到百毫秒级。下面这组数据清晰呈现该技术的妙用:2014年该技术应用前,阿里电商云化平台峰值流量达平日173倍时,就会出现系统崩溃、无响应等现象。2015年起,应用SPS系统后,实现1000万核的实时弹性扩展,峰值流量达平日1069倍时的平稳支撑,无丢单漏单,助力2018年实现双十一日销售额新高。SPS系统服务于国家一带一路战略,进入东南亚、中东、欧洲,面向全球提供云计算服务。它曾技术支持东南亚最大电商平台LAZADA,助力其成功应对LAZADA双十一活动期间超平日15倍的峰值业务流量。

基于存储阵列优化的数据高可靠高吞吐技术:支撑出行领域峰值服务

SPS系统在存储阵列的访问加速、编码优化、高速扩展等方面取得了系列创新。既保证存储数据的高可靠又确保访问的高吞吐是实现突变型峰值服务持续可靠提供的难点,其主要原因在于数据失效时存储阵列恢复慢且扩展困难,高负载情况下故障率会升高。为此,项目进行技术攻关,发明了基于存储阵列的多级缓存算法优化技术、多盘容错存储阵列编码及快速扩展技术,提高了数据可靠性及访问速度,实现了存储阵列单节点数据恢复吞吐率从1.61GB/秒到2.75GB/秒的提升。该项服务为高德地图提供应用缓存数据访问加速、空间数据查询等技术支持,支撑其在2018年国庆期间导航规划105亿次,助力高德地图成为全国第一个日活用户破亿出行服务App。

基于容器和混合部署的高效资源整合技术:推动互联网医疗事业

SPS系统在计算资源的高效整合利用方面取得突破。传统基于虚拟机的资源整合技术开销大、扩展慢、利用率低,无法满足突变峰值时服务持续提供和低成本运营的需求。为此,项目在降低整合开销、加速资源扩展、提高资源利用率等方面发明了低开销富容器及其高速分发、基于容器的应用智能混合部署、非抢占式加速器任务重排等技术。应用于阿里巴巴电商云化平台等多种场景,在保证终端用户请求服务质量的前提下,将硬件资源利用率从10%提高到 45%。同时,在互联网医疗领域,该技术的应用为卫宁健康的产值贡献率约为20%。2015初,卫宁健康云服务产品用户3000家时,即出现响应迟滞、拒绝服务等现象,难以支撑更多的在线用户。2015年12月起,应用强隔离富容器智能混合部署、分布式数据分析加速等技术后,能同时支撑5000多家医院就诊高峰期时段多种在线离线服务。

产学研结合,广泛应用于国计民生各行业,取得巨大经济社会效益

SPS系统实现了云计算基础软件国外产品的替代,推动了核心软件的国产化。该系统已应用在以阿里巴巴电商云为代表的云平台中,除了保障天猫“双十一”活动顺利进行,还以开源形式服务于30余家企事业单位,助力“互联网+”发展。该项技术涵盖电子商务、交通出行、医疗健康、文化社交、电信运营、生活服务等多个行业领域,活跃用户数超十四亿,带来了巨大的经济效益。

吴善阳 张蔚 徐帆