2022年芯片龙头股排名前十的DPU数据中心新王者上位
AI、5G和云计算技术的飞速发展正重塑世界,数据中心作为这些技术的基石,在数字化转型中扮演着关键角色。面对挑战,传统的CPU和GPU已无法满足快速变化的应用需求,而性能更强大、更专用、更异构的芯片则成为数据中心不可或缺的一部分。
芯片巨头们紧跟这一趋势,不仅通过收购还自研了多样化芯片,以应对市场需求。英伟达在去年十月发布了首代DPU BlueField-2,并于今年4月宣布其数据中心策略升级为GPU+CPU+DPU,展现出三者的协同效应。
那么,DPU又是如何在数据中心“上位”的呢?它是一种特殊类型的芯片,其价值体现在哪里?未来数据中心为什么会变得3U一体?
理解DPU之前,我们需要了解它出现的问题所在。在软件定义的环境下,数据中心更加灵活,但也带来了巨大的负担——基础架构运行可能消耗20%-30%的CPU核,因此需要一种新的处理器,即DPU。
以往基于冯诺依曼架构计算模型虽然解决了提高计算性能问题,但随着数据量增加以及AI技术进步,这些模型引入网络拥塞问题,对提升性能造成挑战。而以数据为中心新架构,可以有效解决网络传输中的瓶颈问题或丢包问题,大幅提升通信延时,从30-40微秒降至3-4秒,有10倍提升。
英伟达DPU集成了SoC三个关键要素:行业标准高性能可编程多核CPU(通常基于广泛Arm架构),与SoC组件紧密合作;高性能网络接口能以线速解析处理并将数据传输到GPU和CPU;各种灵活可编程加速引擎,可以卸载AI、机器学习等业务并提升效率。
这使得DPU能够针对安全、网络存储AI等业务进行加速,为以数据为核心计算架构提供创新思路实现以前难以或无法实现功能。这是其第一层价值。第二层价值在于为这种新架构提供创新的思路,使得以前难以或者无法实现的事情成为了可能,如业务隔离、高安全性、高裸金属业务性能等。
例如,在云场景下,与VMWare合作开发Monterey项目,将Hypervisor里的某些功能卸载到DPU上,比如防火墙管理等,这样不仅减少资源利用,还提高了安全性和裸金属业务表现。此外,与RedHat合作,让容器或虚拟化运行时可以实现100G甚至200G全线速而无需消耗任何CPU资源,将所有资源都留给业务使用。
UCloud通过采用英伟达DOCA软件栈与匹配硬件实施了一系列改进,如VPC管理集成到DPU内部,加快转发效率;原10G网卡升级至25G后进一步提升性能。此外,对于存储方面,由于本地盘容易坏盘且维护麻烦,UCloud采用RSSD云盘结合NVMe SNAP功能实现计算与存储解耦,便捷交付、运维减少、三副本增强安全性。
此外,DPU还显著增强了服务器安全性,比如借助BlueField-2测试显示相比软件Hyperscan有3.5倍加速速度;同时支持SSL/TLS加解密及IPSec算法硬件卸载释放出更多算力。
最后,UCloud目标是在一张卡上实现虚拟化与裸金属统一探索InfiniBand网络用于加速AI和高性能计算。
总之,为何能让这个小巧而强大的设备“上位”?
答案在于持续推进英伟达硬件能力以及不断完善DOCA软件栈。一旦达到这一点,它将变成一个令人瞩目的革命者,为那些追求卓越服务质量的人们打开新篇章。