手机CPU天梯图DPU登顶数据中心新霸主
AI、5G和云计算技术的飞速发展正重塑世界,数据中心作为这些技术的基石,承载着数字化转型的重要使命。面对挑战,传统的CPU和GPU已无法满足快速变化的应用需求,而性能更强大、更专用、更异构的芯片则成为数据中心不可或缺的一员。
芯片巨头们紧跟这一趋势,不仅通过收购还自研了多样化芯片。英伟达在去年十月推出了BlueField-2,这是DPU(Data Processing Unit)领域的一次重大突破。而今年4月,英伟达CEO黄仁勋宣布其数据中心策略将由GPU+CPU+DPU组成,并计划逐步推出自研Arm架构CPU Grace。
那么,我们如何理解DPU这项不为人知但价值深远的技术?为什么它能在数据中心“上位”?未来数据中心之所以选择3U一体设计,是因为DPU带来的双重价值:提高效率与降低成本。
首先,我们需要认识到为什么我们需要DPU。黄仁勋曾指出,在软件定义的大数据中心中,基础设施运行消耗20%-30%的CPU核,因此需要一种新的处理器——即DPU。以往以CPU为核心的问题已经显得过时,以数据为核心才能真正满足市场和应用需求。
宋庆春进一步解释道:“以前计算规模和数据量没那么大,冯诺依曼架构很好地解决了提高计算性能的问题,但随着AI技术兴起,以及日益增长的大量数据,与之相适应的是网络传输中的瓶颈问题或丢包问题。”他认为,以数据为中心新架构可以解决这些问题,使通信延时从30-40微秒降至3-4秒,有10倍提升。
英伟达蓝场SoC集成了三个关键要素:
行业标准、高性能及软件可编程多核CPU,即基于广泛使用的Arm架构,与其SoC组件紧密结合。
高性能网络接口,可以以线速或网络速度解析并高效传输到GPU和CPU。
灵活且可编程加速引擎,可以卸载AI、机器学习、安全等业务,并提升性能。
因此,DPU能针对安全性、网络优化、高级存储以及HPC等业务进行加速。这是其第一层价值。而第二层价值则在于,为以数据为核心计算架构提供创新思路,从而实现以前难以实现的事情,如减少对CPU内核依赖,同时提升效率。
例如,在云环境中,一些功能被卸载到DPU上,比如防火墙、存储管理,这样既保证了隔离,又促进了裸金属业务性能。此外,还有RedHat与英伟达合作,将容器操作卸载到DPU上,无需消耗任何CPU资源就能实现100G甚至200G全线速,从而最大化利用硬件资源。
UCloud科技专家马彦青表示,“我们最初选择使用DPU,因为遇到了服务器带宽瓶颈,我们想解决这个问题同时降低成本。”借助DOCA软件栈,他们成功实施了一系列改进:
将VPC管理集成到DPU内部,大幅度提高转发效率。
升级网卡至25G后,大幅提升表现。
在大规模N对N计算任务中,对比原有方案,有明显提升。
数据库服务商采用原有VPC架构部署四台服务器,可替换几张卡板,加快交付时间并减少维护负担。
采用RSSD云盘作为后端存储机群,便于快速交付与故障迁移,同时确保三副本备份更加安全可靠。
加强了深度包检测能力,其中测试显示相比软件Hyperscan加快了3.5倍;同时也支持SSL/TLS加密算法及其IPSec硬件卸载,让更多资源用于业务处理而非监控分析工作流程中的长时间等待时间或者复杂性的增加导致系统崩溃的情况发生,所以现在许多公司正在寻找这种解决方案来提高他们IT部门运营效率并避免因过慢造成额外费用支出的情况出现。在所有这些方面,都体现了一种新的经济学理念:找到一种方式来做事,使得最终结果既符合预期又节省成本。这就是所谓的人类历史上的一个新时代,它代表了一种新的生活方式,也是一种全新的商业模式,它涉及所有行业,而且影响力越来越广泛。如果你没有感觉到这一点,那么请问,你是否意识到了自己生活方式已经发生改变吗?
总结来说,虽然当前仍存在一些挑战,但随着英伟达持续完善其硬件产品以及DOCA软件栈,上述优势将不断扩展,为各个行业提供前所未有的灵活性和有效性。在这样的背景下,不难看出,即便是在那些初次接触此概念的人眼中,看似神秘却实际非常实用的“手机cpu天梯图”,背后的意义可能会让他们惊叹不已。