芯片的基本结构数据中心的新霸主 - DPU崛起

芯片的基本结构数据中心的新霸主 - DPU崛起

DPU(数据处理单元)的崛起:新时代数据中心的核心力量

在AI、5G和云计算技术迅猛发展的今天,数据中心扮演着支撑数字化转型的关键角色。面对不断增长的应用需求,传统CPU和GPU已经无法满足挑战。芯片巨头们意识到了这一点,因此通过收购或自研推出了更加高性能、专用且异构的芯片类型。

英伟达作为领先的一家公司,在去年十月发布了首代DPU BlueField-2,并于今年4月宣布其数据中心芯片战略升级为GPU+CPU+DPU三类芯片,逐步实现飞跃。其中,自研Arm架构CPU Grace也亮相。

那么,DPU又是如何在数据中心“上位”的?它之所以重要,是因为它能够有效地解决软件定义数据中心所带来的负担,其中包括20%-30%的CPU核消耗的问题。以CPU为中心的架构已经不能满足市场和应用需求,而以数据为中心则能更好地应对挑战。

英伟达网络事业部亚太区市场开发高级总监宋庆春指出,以往计算规模小,但随着大数据和AI技术发展,传统计算模型引发网络拥塞问题,即时提升性能遇到瓶颈。他强调,以数据为中心新的架构可以解决这些问题,使得通信延时从30-40微秒降至3-4秒,大幅提升性能。

英伟达DPU是一种SoC,它集成了多核CPU、高速网络接口以及灵活可编程加速引擎,这使得它能够针对安全、网络、存储等业务进行加速,同时提供创新思路,为以数据为核心的计算架构提供支持。

例如,在云场景中,与VMWare合作开发Monterey项目,将OVS卸载到DPU运行,不仅提高效率,还实现了业务与基础设施操作之间完全隔离,从而保证了高安全性并达到裸金属级别业务性能。此外,与RedHat合作,也实现了100G甚至200G全线速运行Hypervisor/OVS或容器操作,而不占用任何CPU资源,全力用于业务处理。

UCloud技术专家马彦青表示,他们选择使用DPU主要是为了解决传统服务器带宽瓶颈,并降低成本。在实施过程中,他们利用DOCA软件栈来优化VPC管理集成到DPU内部,大幅提高转发效率,以及采用NVMe SNAP功能解耦计算与存储,从而实现分钟级交付和快速故障迁移。此外,DPU还显著提升了安全性,比如通过硬件加密算法进行SSL/TLS加解密,加快深度包检测速度等。

最后,由于英伟达持续改进硬件以及DOCA软件栈完善,上述探索将继续深入推进,最终目标是实现一张卡同时支持虚拟化和裸金属架构。这对于未来的AI、高性能计算及其他领域来说具有极大的潜力。