金磊 发自 凹非寺
量子位 | 公众号 QbitAI
他来了,他来了。
【资料图】
手持 GPU ,一身 黑皮衣 、下装牛仔裤、黄皮肤长头发,黑框眼镜之下挡不住硬汉气场。
但他不是英伟达的老黄。
他是曾经老黄左膀右臂之一的老张——
张建中 ,James,此前在英伟达中国区任职一把手长达15年时间。
现在更被人熟知的头衔,是国内GPU公司 摩尔线程 的创始人兼CEO。
而这次刚刚捂热的GPU,已经是他在今年量产上市的 第2个 了——
时隔,仅 半年 之久。
不仅如此,附着在这块GPU上的标签还有更多:
国产 、 全功能 、 全球首个 、 中高端 ……
而且基于它,张建中更是发布了 国内首个 中高端 游戏显卡 。
讲真,很难想象这般“速度”是由一家刚刚成立2年的公司所创造的。
由此不免让人心生疑问:
在做到快的同时,质量和性能上是否也一并跟上了呢?
我们不妨一同来看看。
摩尔线程的第二个国产全功能GPU,名为 “MT-春晓” 。
张建中也是将它作为打头阵的产品发布。
据了解,春晓集成了220亿个晶体管,内置4096MUSA架构通用计算核心以及128张量计算核心,可以支持FP32、FP16和INT8等计算精度。
其它重点参数如下:
GPU核心频率:1.8GHz FP32计算能力:14.4 TFLOPS INT8计算能力:57.6 TOPS 显存宽带:448GB/s 显存类型:GDDR6张健中在现场还提及,春晓解锁了一项“全球第一”:
因为它是业内唯一支持PCIe Gen5接口的GPU。
(许多厂商已经达成共识,PCIe Gen5将会是未来消费级以及企业级存储设备的重点发展方向。)
那么与半年前摩尔线程所发布的“苏堤”GPU相比,二者又有何区别?
张建中表示在摩尔线程GPU四大引擎方面,春晓做到了全面升级:
现代图形渲染引擎性能最高提升3-5倍 AI计算加速引擎性能最高提升4倍 智能多媒体引擎性能最高提升4倍 物理仿真引擎性能最高提升2.5倍至于为什么摩尔线程要在半年时间就将自家GPU推陈出新,这个问题我们请教了下张健中:
我们第一个全功能GPU苏堤,实际上属于中低端处理器,在GPU行业中可以满足国内国产化应用的需求。
但对于大部分主流用户,他们还是期待更高性能的GPU,因此我们快速发布了春晓,去满足高端的游戏玩家,满足更多用户对图形和计算的需要。
如此一来,我们的产品就能够覆盖高中低端的所有用户。
而提到了游戏,张建中基于春晓GPU,便发布了另一款“国内第一”的产品。
其实摩尔线程在半年前基于苏堤也发布过显卡产品MTT S60。
但这张显卡的“用武之地”似乎更多面向的是产业,也就是B端。
而这次基于春晓打造的这张显卡 MTT S80 ,则是能让更多大众摸得着的那种了—— 国内首款游戏显卡 。
在现场,张建中还用了一个比较有意思的词来形容它: “国潮” 。
从性能方面来看,其拥有的4096个可编程MUSA核心,在1.8GHz的主频下,能够提供14.4TFLOPS的单精度浮点算力。
与春晓相似的,MTT S80也是业内首款配备PCIe Gen5接口的显卡产品:
配合16GB GDDR6大容量高速显存,再辅以8K超高清与1080P 360Hz高刷新率显示输出能力,能为游戏玩家带来很好的体验。
似乎“光说不练”并不是摩尔线程发布会的风格,跟上次一样,张建中同样是在现场直接上效果。
例如它已经在Windows环境中适配了 《暗黑破坏神3》 ,而这款游戏对于显卡性能要求还是较高的那种。
而有了MTT S80的加持,即便全程是在4K高清画质的情况下,FPS也能保持在60左右 (FPS越高画面越流畅) 。
除此之外,张建中还展示了赛车游戏爱好者钟爱的 《极品飞车》 ,在MTT S80下的效果,可以说是相当的丝滑了:
据了解,目前MTT S80已经在Windows驱动内置了MUSA DirectX Driver模块,并完成了对数十款主流游戏的适配。
更重要的是,张建中说这款显卡将会在 双十一 当日 限量开售 。
那么到手后的实际效果如何、价格香不香,也是可以期待一下了。
在服务器方面的产品,摩尔线程这次也有更新—— MTT S3000 。
同样的,它也是基于MUSA架构、春晓GPU,算力可以覆盖图形渲染、视频处理、深度学习的完整MUSA软件栈。
支持的场景包括AI推理和训练、云游戏、云渲染、视频云、数字孪生、数字内容创作等。
从性能上来看,MTT S3000包含了4096个MUSA流处理核心及128个专用张量计算核心,晶体管规模达到220亿。
其运行频率为1.9GHz,显存位宽256bit;搭配32GB GDDR6显存,带宽为448GB/s;可以支持FP32、FP16、INT8等多种计算精度,其中FP32算力可达15.2TFLOPS。
在张建中看来, 生态协作对于AI应用的推进至关重要 。
因此,MTT S3000还兼容了PyTorch、TensorFlow、百度飞桨 (PaddlePaddle) 、计图 (Jittor) 等多种主流深度学习框架,并实现了对Transformer、CNN、RNN等数十类AI模型的加速。
而且MTT S3000可以说是做到了“与时俱进”,最近大火的AI作画:Disco Diffusion、Stable Diffusion也是同样能够hold住。
而除了上述的硬件产品之外,纵观正常发布会, “软硬件结合” 也是摩尔线程的一大特点。
这一点其实也不难理解,在我们与张建中交流的过程中,他也道出了缘由:
软件生态是推动GPU计算普及的关键。
GPU的研发体系是非常复杂的,有了硬件才能去开发软件,软件在硬件上跑起来了之后,还需要做更多优化;优化之后又会发现架构存在缺陷,反过来又得优化硬件。
硬件、软件是互相迭代、不停提升的一个过程。
为此,摩尔线程这次以MUSA架构为核心,摩尔线程发布了完备的 MUSA软件栈 。
其目的就是服务广大的开发者和终端用户。
除此之外,摩尔线程在GPU云原生、元宇宙、AIGC方面均有相应的新动作。
还是聚焦在张建中这次的outfit:
这个皮夹克,嗯,着实有点意思。
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态