近年来,人工智能正经历新一轮的快速发展与普及,海量的、参数规模庞大的大模型在这一过程中起到关键作用。这些大模型对计算能力的需求不断攀升,也需要更高带宽的内存和性能,进而催生了处理海量数据的服务器技术的不断发展与革新。总的来看,生成式AI等高级数据中心工作负载需要最高带宽和容量的服务器RDIMM,以满足不断增长的数据管道不断增长的内存需求。
面对这一需求与挑战,Rambus于近日推出全新DDR5服务器电源管理IC(PMIC)系列,包含适用于高性能应用的业界领先超高电流电源器件。Rambus内存互连芯片业务部门产品营销副总裁John Eble表示:“随着Rambus服务器PMIC的发布,Rambus可以为RDIMMS提供完整的芯片组。同时,Rambus凭借30年的经验,为业界提供高性能内存技术。”Rambus发布的全新服务器PMIC系列支持广泛的数据中心用例。
生成式AI需要更大内存带宽和容量
事实上,人工智能应用的发展需要更高带宽的内存和性能。在采访中,John Eble以OpenAI的数据对此进行说明。他表示,OpenAI在全球最大AI训练项目上的计算需求自2012年起每年激增10倍,以ChatGPT为例,其从GPT-3(1750亿参数)到GPT-4(1.5万亿参数)的迭代,在短短数月内实现了参数量的巨大飞跃。
不仅如此,在John Eble看来,AI训练数据集规模还将保持高增长速度,只有这样大模型才能获得更加准确、全面和强大的人工智能模型。参数规模和数据集规模的持续壮大便得益于服务器内存技术的快速发展,能够高效处理海量数据。因此,人工智能应用的发展将需要更高带宽的内存和性能。
大模型训练对内存带宽和容量提出哪些需求?John Eble通过简化的AI训练管道向媒体展示了这一需求。我们知道,AI训练从数据采集到推理模型需要经过数据存储、数据准备、训练等环节,每个环节对于内存带宽和容量的需求不尽相同。
其中,在数据存储管道里保存着大量的人工智能数据集,这一环节对于存储服务器的主内存容量要求不高。在数据准备阶段,模型需要将数据进行整理、正常化、验证,并对主内存的容量提出新的较高的需求。而在训练阶段,主内存的容量需求是GPU内存的两倍,并且要求主内存有较高的带宽。
“AI训练覆盖了从数据的初步采集,历经数据存储、数据准备与训练,直至最终构建出推理模型的完整路径。此流程为便于理解而有所简化,但在现实应用场景中,无论是大型集群还是单一实例,其所需的内存容量将是简化的AI训练模型容量的数倍。”John Eble表示。
基于DDR5技术DIMM架构实现更高的内存性能
John Eble认为,应用DDR5技术的更智能的DIMM架构能够实现更高的内存性能。
首先,目前DDR5内存已经开始采用双通道架构。DDR5 RDIMM架构,在DDR5中数据流的通道比特率是32,加之8位的ECC,以保证他们能够在连接器上有着各自所需要的存储、吞吐量,以及内存性能。
其次,双通道RCD在主机端以DDR5速度运行,其运行速度与DRAM相同,每个引脚的开关频率将比DDR4高出一倍有余。
不仅如此,DDR5内存技术的每通道最高频率速度已提升至8400MT/s,然而,值得注意的是,根据JEDEC于今年四月最新发布的数据标准,DRAM规格现已能支持高达8800MT/s的传输速率。
“更高的数据传输速率、数据信号所需的连接器引脚数量的增加以及主电源电压从1-1.2V降至1.1V等因素促使Rambus采用专用的电源管理IC,帮助控制更加精细的电压。”John Eble表示。
Rambus在DDR5模块增加PMIC和相关的无源组件,由内存模组上的PMIC向模组提供输入高压12V电源,避免通过模块连接器从主板向内存模组组件输出如1V的电压,大大降低了输电网络上的IR下降问题。
具体来看,PMIC模块的专门设置四个开关降压调节器,其中两个为双相配置调节器,两个为低压差调节器,以此为模块上的各种组件产生总共五个不同的电压供应和电压水平。 此外,将PMIC集成到内存模块上极大地简化了主板设计,减少了所需的面积,并降低了电源系统过度配置的浪费。
John Eble表示:“PMIC是DDR5内存架构中的关键组件,可实现更多的内存通道、更大容量的模组和更高的带宽。”
全新DDR5服务器PMIC系列发布
Rambus已开始提供样品并与客户合作,推出第一代面向所有模块类型和所有服务器类别的DDR5服务器 PMIC 芯片系列。针对不同电流输出水平,Rambus DDR5 PMIC系列包括符合以下JEDEC规格的产品:极值电流(PMIC5020)、高电流(PMIC5000)、低电流(PMIC5010)。
其中,Rambus打造的PMIC 5020旨在成为面向下一代AI训练服务器和其他高级工作负载提供最高容量和最高性能的模块类型。PMIC 5020特别针对高电流需求进行了优化,其设计目标是支持约30安培的最大持续直流电流,确保了极高的电流承载能力。PMIC 5020专注于满足最高带宽和最高容量的需求,而Rambus成为首家提供该样品的企业。
而作为主要的PMIC,高电流PMIC 5000支持的最大持续直流电流为20安培。这款特定的PMIC针对标准到四阶模块,容量为64GB、96GB和128GB。此外,低电流PMIC 5010面向容量较低的市场,支持的最大持续电流约为12安培。
Rambus打造的DDR5 RDIMM完整芯片组,均经过预先严格的验证流程,确保为客户提供的是具备高度互操作性、卓越时序表现及出色功率优化的产品。同时,Rambus依托稳固的供应链体系,确保产品供应的充足与稳定。
此外,通过提供单一来源的支持服务,Rambus助力客户简化流程,减少因额外组件验证而耗费的资源。客户可直接利用这些已经过验证的模块与组件,快速构建组合矩阵,从而大幅缩短产品交付周期,并在实际安装与调试阶段节省宝贵的时间与精力。
写在最后
生成式AI的发展为各行各业带来新的机遇与挑战,其中,在技术底层,生成式AI等高级数据中心工作负载需要具有最高带宽和容量的服务器RDIMM。在此背景下,我们看到以Rambus为代表的厂商在高性能内存领域付出的努力。
如今,凭借30多年的经验,Rambus已成为RDIMM制造商的“一站式”DDR5内存接口芯片供应商,能够为制造商提供最高级别的验证保证并加快其产品上市时间。同时,Rambus也在为生成式AI的发展贡献着自己的力量。