AMD在今年1月的CES 2023大会上正式发布了锐龙7000系列移动处理器,其中核心代号“Phoenix(凤凰)”的锐龙7040系列受到了用户和业界的广泛关注,毕竟它是AMD旗下首款内置AI引擎的X86处理器,在今年AI应用井喷式爆发的环境下,对AMD的未来布局意义非凡。而在前不久,雷蛇旗下首款搭载锐龙9 7940HS处理器的笔记本产品也正式开售,这也让锐龙7040系列成为了首批正式上市的X86 AI处理器,同时也标志着AMD率先将X86处理器带入了AI时代。
引领X86进入AI时代的AMD Ryzen AI是什么?
(资料图片仅供参考)
了解过Stable Diffusion之类AI应用工具的朋友都知道,其实用传统的CPU架构也能实现AI计算,只是效率方面并不能与专用的AI引擎硬件加速相比,那么具体的原因是什么呢?这里不妨以AMD锐龙7040系列独创的XDNA AI引擎为例进行分析。
传统的多核心处理器架构采用了固定的共享连接方式(通过缓存),如此一来核心之间数据传输排队造成的阻塞就限制了计算能力,而且时序也并不是固定的。同时,这样的架构在内存利用方面也增加了对带宽的抢夺,减少了内存的可用量。综合这些因素来看,传统的多核心架构其实并不是AI高效计算的最优解。
AMD的XDNA AI引擎则专为AI计算而生。它内部的AI引擎单元采用类似Mesh的专用方式进行互联,各个单元之间都可以直接通信,因此不存在数据阻塞的情况,同时也保证了时序的确定性。此外,每个AI引擎单元都配备了分布式本地内存,不会出现缓存未命中的情况,同时拥有更高的访问带宽,也降低了对内存容量的需求。
由于内置在处理器中的XDNA AI引擎架构可以脱离云端工作,所以在本地也可以无延迟地处理不同的AI神经网络计算,包括CNN(卷积神经网络)、RNN(循环神经网络)、LSTM(时间递归神经网络)等,并支持INT8,16,32、BFloat16等各种数据类型,还具备实时多任务能力,可处理最多4条并发空间流,峰值算力可以达到10TOPS(每秒10万亿次计算),因此是远超CPU和GPU能效的。
除了相对传统处理器架构更高的性能和能效以外,AMD Ryzen AI引擎还改变了推理模型的处理方式。它不再像传统神经网络那样只能在多个“神经元”之间一层一层地逐次流动,而是采用了全新的适应性数据流架构和适应性互连,针对不同负载、模型、数据,由不同单元、层级进行同步处理,从而大大提高效率和能效,还可以由开发者进行定制,找到更适合特定负载的处理方式,进而实现效率最大化。此外,Ryzen AI引擎在安全性和隐私保护方面也更优秀,因为本地AI网络不依赖云端,数据都是直接在本地完成,所以不用担心个人数据和内容泄露,更不会成为神经网络模型的一部分。
当然,处理器光有好的AI引擎也不能充分发挥其性能,必须从操作系统层面进行深度优化才能获得最好的效果。因此AMD Ryzen AI引擎是与微软深度合作打造的,它工作在微软AI框架之下,软件通过编译来访问锐龙处理器的AI引擎。因此,开发者不需要去考虑AI引擎的硬件层面,自然也不用担心兼容性的问题。目前微软Windows 11自带的Windows Studio Effects就已经对AMD Ryzen AI引擎提供了支持,在配备锐龙7040系列处理器的笔记本上,可以对内置摄像头采集的画面进行后期处理,提供背景效果、自动取景、眼神接触等功能。
未来,AMD Ryzen AI引擎还会在更多领域大显身手。比如Text to image,说说话就能制作出高品质的画作。像Adobe Premiere Pro等生产力软件现在已经拥有AI功能了,未来也会加入更多的AI硬件加速支持。AI智能工作助手可以安排日程、撰写演讲稿与邮件,还能整理预算、制作PPT、语音转文字等等;AI生活助手,可以精准、快速地整理大量图片和视频文件,方便归档或分享;AI视觉与游戏增强方面,可以在游戏中插帧或提升画面精度,AI驱动的NPC角色也可以实现实时对话、互动,让游戏更有“人性”。
其实,这些应用场景现在已经能够通过云端AI服务器和本地的高性能处理器与GPU来实现,而现在有了X86处理器专属的AI引擎,就可以在本地高效完成了。同时对于笔记本来说,由于AI引擎可以彻底解放处理器和GPU的AI运算压力,所以还能够有效延长电池续航。
另外,根据目前的信息来看,很可能命名为Windows 12的下一个版本的Windows将专注于AI体验,深度集成人工智能功能。包括 Windows 分析当前正在查看的信息并根据上下文提示,以快速启动项目或应用的功能。Windows还可以识别图像中的对象和文本等等,但诸如此类的AI功能将需要像Ryzen AI这样的专用硬件支持才能运行。
同时,为了方便开发者以最高效率使用Ryzen AI引擎,AMD在对开发者的支持方面也相当重视。其中独特的一体化AMD AI堆栈可以综合利用处理器、XDNA架构的算力与能力,支持ONNX、TensorFlow、PyTorch等多种模型。微软、OEM厂商、ISV独立软件开发商、个人开发者都可以自由使用它们。
按照AMD的路线图,Ryzen AI软件平台将于今年晚些时候全面推出,它将为开发人员提供将AI添加到现有应用程序所需的工具,并创建全新的程序。
AMD在5月曾经首次公开展示了这一软件,提供了开发人员可以试用的demo和代码样本。而在今年夏天,AMD通过临时版本推动了这一进程,增加了对运行在IPU上的新操作符的支持,并提供了对ONNX、PyTorch和TensorFlow模型的量化支持。开发者可以在AMD官网访问Ryzen AI软件文档页面了解更多详细信息。
未来的Ryzen AI软件版本将支持更多在AMD XDNA上运行的操作,ONNXRT Execution Provider(EP)对Vitis AI提供上游支持,将根据工作负载的特性自动决定是在CPU上还是在AMD XDNA AI引擎上运行。
开发人员可以采用PT、TF和ONNX格式的训练模型,使用AMD Vitis AI Quantizer或者Microsoft Olive Quantizer将这些模型量化为INT8,并使用带有Vitis AI Execution Provider的ONNX Runtime进行部署。前者将对代码进行分区和编译,以运行在AMD XDNA AI引擎或CPU上。
今年晚些时候,AMD将发布更多的工具链、库和指南,以简化人工智能开发。AMD还计划增加对Generative AI模型的支持。
在初步了解了Ryzen AI引擎的相关知识之后,接下来我们看看首款内置AI引擎的锐龙移动处理器具体表现如何。
锐龙9 7940HS:首款内置AI引擎的X86旗舰移动处理器
▲锐龙7040系列核心代号Phoenix,采用4nm、Zen 4架构,内置AMD Ryzen AI引擎
目前x86处理器中集成专门AI处理模块的,只有锐龙7040H/HS系列。据说,英特尔要等到下一代处理器,也就是第14代酷睿可能才会有类似的设计,在其下一代Meteor Lake处理器内部集成AI单元。英特尔官方也在COMPUTEX 2023展示了其下一代Meteor Lake处理器的AI性能,从结果来看,虽然算力效率没有GPU高,但处理器内部几个单元的协同工作效率的提升仍然是可观的,也由此可见专用AI引擎的优势。
而部分型号的AMD 锐龙7040系列处理器上现在已经配备了专用的Ryzen AI引擎,不但可以支持Windows11的早期AI功能,更可以为将来的Windows 12操作系统提供更强大的支持。AMD锐龙7040系列移动处理器核心代号“Phoenix”,采用领先的4nm制程和全新的Zen 4架构,相对上代Zen 3/3+架构在IPC、工作频率以及能效比方面都有明显提升。当然,锐龙7040系列最大的看点还是在X86平台首发内置AMD锐龙AI引擎,在AI应用中能提供专用加速功能。
采用全新Zen 4架构的锐龙9 7940HS具备8大核16线程,三级缓存16MB,基础频率,最高加速频率高达;集显部分,它内置了RDNA 3架构的Radeon 780M,拥有12个CU,频率高达2800 MHz;内存部分,支持双通道DDR5 5600或LPDDR5X 7500。TDP方面,AMD官方给出的标准是35W~54W可调。总而言之,拥有8个全规格大核、高频率、内置AI引擎和最强集显的锐龙9 7940HS可以说是目前轻薄性能本移动处理器中旗舰级的存在。
▲雷蛇灵刃14 2023首发搭载锐龙9 7940HS处理器
雷蛇灵刃14 2023首发搭载了锐龙9 7940HS处理器,它定位高性能轻薄游戏本,整体的重量仅有千克,厚度为毫米,这对于一款内置锐龙9 7940HS旗舰处理器+RTX 4070独显的游戏本来讲已经是相当轻薄了。
▲实战体验微软Windows 11内置的Camera应用里由AMD Ryzen AI引擎提供的特效
前面已经介绍过锐龙9 7940HS内置的AMD Ryzen AI引擎是和微软深度合作打造的,目前已经在Windows 11中得到了支持。下面我们就深入体验一下实际效果。打开Windows 11自带的Camera应用,可以看到右侧菜单拥有三个选项,分别是“Automatic framing(自动取景)”、“Eye Contact(眼神接触)”、“Background effects(背景效果)”。
自动取景功能可以自动缩放画面,使得焦点人物始终在画面中间;眼神接触则让人物的视线看起来始终对着镜头;背景效果则可以虚化背景,突出焦点人物。只有CPU内置AI引擎,才会使用这3个功能,所以目前只有AMD锐龙7040系列可以开启。实际使用中Ryzen AI引擎加速的效果非常明显,而且非常方便,相对需要安装第三方APP的GPU方案来讲,这在追求长续航的轻薄本上确实是一个能效更高、更易用的AI加速方案。
总结:Ryzen AI引擎领衔,AMD开创高能效AI时代
最后简单总结一下。AMD旗下的锐龙7040系列移动处理器除了性能与能效大幅升级之外,其内置的 AMD Ryzen AI引擎更是开创了移动办公本地AI应用高能效加速的时代 ,为AMD进军AI普及应用领域拿下第一城,也为AMD建立完整的AI生态圈打下了基础,代表着AMD从云端到本地的AI产品线布局目标达成。
同时,AMD与微软深度合作、推出相应的软件包也让开发者能够更方便地使用Ryzen AI引擎,在各种AI应用中发挥出最佳的性能与能效。而且,随着下一代Windows操作系统中加入更多的AI应用和特性,AMD锐龙7040处理器凭借专用的Ryzen AI引擎,不但可以超前支持下一代特性,还有先发优势,势将带来更强的体验。
而首发即惊艳业界的锐龙9 7940HS也有不俗的性能表现,它的8个大核可以做到最高全核水平,单核更是高达以上,相对上代提升非常明显,内置Ryzen AI引擎更是让它如虎添翼,不但可以在现有的应用中发挥极强的性能也能在未来的AI应用中提供全新的高效体验。
可以预见的是,在未来AMD通过与合作伙伴的深度优化,Ryzen AI引擎还可广泛用于数据分析、智能助手、计算视觉、生产创作等诸多场景,再加上EPYC处理器、Radeon Instinct加速器、Xilinx加速器等全产品线支持AI的优势,AMD已经拥有了一整套的AI解决方案,可以为用户提供最为全面的AI支援,相对于其它专攻单一产品线的对手来看,AMD在AI方面的潜力更加强大、更具有可持续发展性。
关键词: