热议:SK海力士首推基于CXL的存算一体计算存储器解决方案CMS

据 SK 海力士官方消息,继今年 8 月推出公司首款 CXL 存储器样品后,SK 海力士此次成功开发行业首款将计算功能与 CXL 存储器相结合的 CMS(Computational Memory Solution)。

计算内存和CXL 连接的外部内存池是技术发展的热点。DRAM 和 NAND 制造商 SK 海力士将两者结合起来,与姊妹公司 SK Telecom 联合开发,以加速机器学习和大数据分析。

计算内存和存储的瓶颈在于它们不使用x86 处理器,因此来自标准服务器应用程序的代码无法在它们上运行。计算存储需要定制代码,而计算内存更难构建,因为它需要专门的硬件、指令集和代码。SK 海力士发现姊妹公司 SK Telecom 使用的机器学习应用程序可以通过在计算内存系统 (CMS) 硬件中实现来加速。


(资料图片仅供参考)

SK 海力士内存系统研究负责人 Park Kyoung 表示:“通过计算功能的内化,CMS 在特定计算中实现了比数十个 CPU 内核快数倍的性能。考虑到这只是一个原型,我们认为我们可以进一步提高性能,并正在考虑将该技术应用于其他应用,例如大数据。”

这家内存制造商声称,CMS 还避免了 DRAM 和主机服务器的 x86 CPU 之间的大量数据传输,从而节省了电能。

SK海力士计算CXK存储卡原型

SK Telecom 已开发并在各种商业服务中运行其自己的 Lightning DB,这是一个内存数据分析平台,用于处理大量数据。这涉及将大量数据划分和存储在更小的单元中,然后对这些单元进行优化的并行处理。SK 海力士和 Telecom 同时开发了 CMS 和 CMS 应用的 Lightning DB。

SK Telecom 副总裁兼视觉研发负责人 Yang Seung-ji 表示:“为 SK Telecom的实际应用服务选择了有意义的计算,通过共同执行从硬件-软件结构设计的所有流程,帮助我们节省了大量时间开发和验证。随着我们验证了解决方案的性能改进,我们计划在未来将它们应用于筛选任务,以提高大规模 AI 学习数据的准确性,并利用它们来增强 SK Telecom 的 AI 服务的竞争力。”

SK 海力士已经开发了CXL-connected memory。CXL(Computer eXpress Link)是一种开发标准,用于使用 CXL 协议消息通过 PCIe 5 总线将服务器 CPU+DRAM 与加速器和 DRAM 池互连。这种外部 DRAM 可以与服务器直接连接的 DRAM 组合成一个更大的内存池。

对于计算 CXL 内存,考虑从 PCIe 4 端点开始的嵌入式处理器卡,然后是 CXL 端点。数据和命令通过它们进入,控制单元处理队列中的命令,AXI 总线将控制单元和命令队列与过滤器、KNN 加速器和负载平衡器(板载内存接口)互连。

有四个存储库,每个存储库都有自己的控制单元。

这不是三星 PIM意义上的计算内存,每个内存库中都嵌入了一个可编程计算单元 (PCU)。它更像是计算存储,处理器位于存储驱动器中,与存储介质相邻。

SK 海力士和 Telecom 共同开发了 Lightning DB 服务器,其系统中包含 hynix CMS。

CXL是什么?

Compute Express Link(CXL)是高速中央处理器(CPU)到设备和CPU到内存连接的开放标准,适用于处理器、内存扩展和加速器。从本质上讲,CXL技术保持了CPU内存空间和附加设备上内存之间的一致性,这可以实现资源共享以获得更高的性能,降低软件堆栈的复杂性,并降低整体系统成本。

CXL联盟已经确定了受益于新互联的三类主要设备:

类型1设备:智能NIC等加速器通常缺乏本地内存,但是,它们可以利用CXL.io协议和CXL.cache与主机处理器的DDR内存进行通信。

类型2设备:GPU、ASIC和FPGA都配备了DDR或HBM内存,并且可以使用CXL.memory协议以及CXL.io和CXL.cache,使主机处理器的内存在本地可供加速器使用。它们还位于相同的缓存连贯域中,有助于提升异构工作负载。

类型3设备:CXL.io和CXL.memory协议可用于内存扩展。例如,连接到CXL总线的缓冲区可用于实现DRAM容量扩展、增加内存带宽或添加持久内存,而不会损失DRAM插槽。实际上,这意味着以前取代DRAM的高速、低延迟存储设备可以用支持CXL的设备来补充它,包括各种形式的非易失性技术,如附加卡、U.2和EDSFF。

CXL通过精简和改进低延迟连接以及内存一致性可显著提高计算性能和效率,同时降低TCO。此外,CXL内存扩展功能可在当今服务器中的DIMM插槽之外提供额外的容量和带宽。CXL可以通过连接CXL的设备向CPU主机处理器添加更多内存,当与持久内存配对时,低延迟CXL链路允许CPU主机将此额外内存与DRAM内存结合使用。考虑到这些是大多数企业和数据中心运营商正在投资的工作负载类型,CXL的优势显而易见。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

关键词: 控制单元 应用程序 工作负载

推荐DIY文章
主机存在磨损或划痕风险 PICO4便携包宣布召回
穿越湖海!特斯拉Cybertruck电动皮卡可以当“船”用
vivoXFold+折叠旗舰开售 配备蔡司全焦段旗舰四摄
飞凡R7正式上市 全系标配换电架构
中兴Axon30S开售 拥有黑色蓝色两款配色
荣耀MagicBookV14 2022正式开售 搭载TOF传感器
it