台积电之谜如何在06秒内将手机变身AI时代的先锋

台积电之谜如何在06秒内将手机变身AI时代的先锋

在智能手机上,AI的进步令人瞩目。从15秒到0.6秒,我们见证了一个巨大的飞跃。瑞泽曾经对此感到惊讶,现在他已经习惯了点击屏幕后立即生成图片的速度。这一切都归功于高通公司研发的骁龙X Elite,这款AI PC处理器能够以30 tokens/s的速度运行70亿参数的大型生成式AI模型,比普通人每分钟阅读200-300个单词快多了。

触手可及的智能手机和AI PC,让我们进入了一个全新的世界。在这个世界里,用一张照片,就能瞬间生成超乎想象的图像;用手机“看”几秒食物,就能知道是否还能食用;对着贴身数字管家说出旅行要求,马上就能获得专门定制的旅行计划。

高通公司总裁兼CEO安蒙表示:“生成式AI在终端上的应用呈几何增长,一年前我们只能看到几个用例,现在有数百个,预计到2024年,我们将会看到上千个用例。”这场变革正在发生,每一次重大技术更新,都需要强大的计算和连接力作支撑。高通将成为这场变革中的主角,让端侧AI像电力一样全面融入我们的生活。

瑞泽最常用的手机AI功能是拍照,但最新旗舰级第三代骁龙8不仅可以实时合成前后摄像头画面,还带来了超越想象力的全新功能,如“照片扩展”,可以让任意照片具有广角效果。这些任务都是在手机端完成,不需担心隐私问题,也不需付月费。

高通与合作伙伴一起打开了生成式AI世界的大门,并非一蹴而就,他们2015年首次将AI技术集成到商用的产品中,此后逐步应用到了影像和视频技术中。三年前,当第三代骁龙8开发时,终端智能就被放在首位,这也是为什么发布后的第一天,它们就能从15秒速降到0.6秒。

第三代骁龙8如何实现数量级性能提升?强大的硬件是基础,其CPU性能相比前代提升30%,GPU性能提升25%,Hexagon NPU性能直接翻倍。这使得它站在行业之巅。此外,还通过改进架构、提高向量加速器主频、升级独特微切片推理技术等方式,加速Transformer网络推理,以及支持业内最新LPDDR5-x内存,以更快数据速度和更大带宽支持用户运行更大、更复杂的AI模型。

要让第三代骁龙8能够以每秒20个token速度运行大语言模型(如Llama2),还需要升级高通AI软件栈工具。“我们先将庞大的AI模型量化到INT4,实现了性能、精度和效率之间绝佳平衡,再充分发挥业界最快DDR内存优势”,Ziad Asghar说,“Hexagon NPU能够以闪电般速度支持LVM。”

除了图像生成,聊天机器人也是重要应用之一。为了让大型模型流畅运行,在终端上使用推测性解码技术。而虚拟形象则利用Adreno GPU强大的渲染能力,使嘴形和声音同步更加真实感受。此外,还有多模态AITech,可以结合视觉、文本、语音,为用户提供更加直观且个性化服务。

同样触手可及的是PC也会是进入艾世界的一个任意门吗?目前,我们正处于PC计算变革的一刻,由于受到高度个人化、大自然互动、高效创造性的需求驱动,而不是只是追求更多核心处理能力或显卡能力。在这一点上,可谓触摸未来:轻薄笔记本电脑既拥有极致表现又保持体积小巧,是移动工作与娱乐双重利剑。不过,无论是在智能设备还是个人电脑领域,对接这样的科技创新对于日常生活来说无疑是一个巨大的转变,从而进一步深化人们对科技潜力的理解并期待未来可能产生更多变化与突破。