9月5日,2022开放数据中心(ODCC)峰会在北京国际会议中心拉开帷幕,本次峰会以“畅享算力精彩 共赴低碳未来”为主题,政府主管部门领导、行业机构、知名企业等各方重量级嘉宾出席了本次峰会,共同探讨东数西算、服务器、数据中心网络、边缘计算、数据中心安全等重点话题,展示最新创新应用,献策数据中心产业高质量发展。
图|2022开放数据中心峰会
作为未来数据中心的网络核心、算力提升的关键器件——智能网卡(DPU)也成为了本次峰会关注的热点之一。国内DPU头部研发企业云脉芯联受邀出席参展,并通过现场测试方式展示了其自主研发的基于智能网卡(DPU)的RDMA技术成果,这也是国内自研RDMA技术和可编程拥塞控制算法平台的首次对外公开亮相。
图|云脉芯联展台前工作人员与用户交流
RDMA,即Remote Direct Memory Access,是一种直接内存访问技术,它将数据直接从一台主机内存传输到另一台主机,数据从一个系统快速移动到远程系统内存中,无需双方操作系统介入,不需要经过CPU的耗时处理。
RDMA对比传统TCP传输方式在提升吞吐、降低CPU利用率、降低延时方面均有明显的优势。随着网络进入100G以上带宽,传统TCP协议栈内核转发已经无法满足高性能要求,具有高吞吐、低延时特性的RDMA技术将承担基础的网络传输功能,在提升数据中心整体算力上发挥重要的作用。
为了更好的实现RDMA高性能、低延时的技术优势,需要端到端的拥塞控制来避免拥塞和降低网络延时,因而RDMA的研发具有很高的技术门槛。
云脉芯联自去年成立以来,不断在技术研发上创新突破。目前,云脉芯联DPU产品技术升级迭代工作进展顺利,研发团队已完成了RDMA关键技术的功能验证,包括自研驱动到标准VERBS接口及PerfTest应用的全面打通,并且在RoCEv2协议层面完成了和业界主流商用RDMA网卡的对接。同时,基于云脉芯联自主研发的HyperdirectTM技术,实现了GPUDirect RDMA功能,并与业内主流GPU对接成功,有效提升了整体算力能力。
近期,云脉芯联也携手国内顶尖数据中心解决方案提供商,在智能无损数据中心解决方案架构中部署了智能网卡(DPU)产品metaFusionTM-50,并进行了RDMA规模流控测试,验证了可编程拥塞控制算法在规模组网和复杂流量模型下的无损效果,时延和吞吐指标均满足预期。
图|云脉芯联展台自研RDMA技术现场测试及成果展示
在峰会现场,云脉芯联向到会嘉宾展示了其可编程拥塞控制算法的性能及稳定性。测试工程师依照云数据中心的标准架构,搭建了包括若干台服务器和交换机在内的网络集群,并模拟数据中心典型的RDMA流量模型,构造了包括Incast、Full-mesh在内的多种拥塞模型,对metaFusionTM-50智能网卡(DPU)、RDMA软硬件以及可编程拥塞控制算法持续压测。在峰会参展的48小时内,整个测试集群始终保持零丢包、满带宽、低延迟的性能指标,测试表现优异。
图|云脉芯联创始人&总裁吴吉朋
此外,云脉芯联创始人&总裁吴吉朋在峰会上发表了题为《融合、开放、极致——DPU的未来之路》的演讲,详尽阐述了云脉芯联基于DPU产品的“TOP创新理念”,即“融合互联-Converged Transport”、“开放平台-Open Platform”以及“极致能效-Hyper Performance”,为未来DPU产品的发展路径指明了方向。吴吉朋坦言:DPU不仅预示着数据中心架构的变革,它也同步带来性能、功耗和安全的优化,由于DPU 可重新分配算力和优化算力资源,更带来了新的数据中心创新范式和经济价值上的提升,这也赋予了DPU更多新的使命。紧紧把握好DPU带来的重大时代机遇,我们相信在大芯片领域一定会实现重大突破,未来可期!