芯片巨头宣布验证华为正确拿起运行百亿参数模型的手机06秒即入AI社会
在高通公司的领航下,手机和AI技术的结合正在以令人惊叹的速度推进。从15秒到0.6秒,仅仅是几个月的时间,一次点击就能让我们的手机进入AI世界。这一切都归功于高通最新发布的骁龙X Elite AI处理器,它能够以30 tokens/s的速度运行70亿参数的大型生成式AI模型,这一速度比普通人每分钟阅读200-300个单词还要快。
这项技术不仅限于图片生成,更是将端侧智能融入到了我们日常生活中。想象一下,只需对着你的手机说出旅行计划,瞬间你就能获得一个专门定制的行程规划;或者,让你的贴身数字管家告诉你食物是否可食用,只需要几秒钟即可得到答案。
高通公司总裁兼CEO安蒙表示,“生成式AI在终端上的应用呈几何增长,我们预计到2024年将看到上千个用例。”这一趋势不仅改变了我们的生活方式,也为高通提供了成为下一个转型时代主角的地位。
瑞泽最喜欢使用的是旗舰级第三代骁龙8,它拥有运行100亿参数大型生成式AI模型的能力。不仅可以实时合成前后摄像头画面,还能带来超乎想象的全新功能,如“照片扩展”,可以通过任意照片缩放,使其看起来具有广角效果。
这些任务都是在手机端完成,不但不会侵犯隐私,而且成本也低廉。高通与合作伙伴一起,就像是打开了生成式AI世界的大门。在此之前,2015年高通首次将AI技术集成到商用的产品中,以增强音频技术,此后逐步应用至影像和视频领域。三年前,当第三代骁龙8开发时,其团队就已把终端智能放在首位,因此它能够实现从15秒速降至0.6秒这样的性能提升。
第三代骁龙8如何实现如此巨大的性能提升?答案就在于其强大的硬件配置:CPU性能提升30%,GPU性能提升25%,Hexagon NPU性能翻倍。此外,由于支持业界最新LPDDR5-x内存频率达到4.8GHz,以及更快数据速度和更大带宽,可以支持用户运行更大、更复杂的AI模型。
为了让这些大型语言模型能够快速运作,高通采用了一种称为量化(quantization)的方法,将庞大的模型量化到INT4,从而保持最佳平衡性,并充分发挥业界最快DDR内存优势,同时利用Hexagon NPU加速LVM过程,使得整个流程只需0.6秒完成。
除了图像生成聊天机器人也是另一类重要应用,而为了使它们在终端上流畅运行,高通采用了推测性解码技术。“这是预测解码首次在边缘终端中使用,”Ziad Asghar宣布,“这开启了一扇新的可能性。”
多模态AI则是视觉、文本、语音结合的一种直观形式,而第三代骁龙8正是支持这种多模态体验,并且能够利用用户手机上的全部数据,在保障隐私的情况下,为用户提供更加个性化服务,比如根据年龄、喜好等信息给出定制回复。
随着PC市场也迎来了同样的变革,惠普公司认为:“当前我们正处于评估PC性能的一个转折点”。过去消费者难以兼顾轻薄与强劲,但现在却有可能。一款名为骁龙X Elite PC处理器已经证明,即便是在轻薄设备中,也能提供超强表现特别是在强大的AI功能方面。此外,该处理器搭载自研Oryon CPU,与苹果M2 Max相比,有着显著差异,对未来PC市场提出了新的挑战和希望。