存储挑战升级,西部数据如何重构存储基础设施新范式?

Yu |  2026-01-09

  数字化浪潮浩浩汤汤,数据已远超单纯的信息属性,成为企业的战略资产,而存储正是承载这份资产、释放其价值的关键基石。

  与此同时,近年来人工智能(AI)作为引领时代变革的重要引擎,正深度融入各行业,推动创新与效率的持续提升。AI的技术突破与规模化落地离不开海量数据的支撑,而数据的存储能力更直接决定着AI价值释放的广度与深度。

  AI规模化之路的存算困局与解耦式破题

  随着企业越来越多地在整个AI流程中处理文本、图像、视频等海量非结构化数据,AI工作负载的规模与复杂性持续攀升,这就要求存储系统不仅要提供高吞吐量、低延迟和运维敏捷性,还需符合严苛的能效标准。然而,传统存储架构受限于存储与计算资源耦合的设计,难以高效地为数据密集型的GPU提供数据支持。如何突破存算瓶颈,已成为当前AI基础设施建设的重要议题。

  解耦式存储为应对这些挑战提供了一种现代化的解决方案,其核心是在不改变逻辑连接的前提下,将存储和计算资源从服务器中解耦,让企业能够获得独立扩展的灵活性,从而实现更高的效率、性能和可持续性。既能仅增加真正短缺的资源以精准扩展、避免不必要的整体投入,又能压缩算力等待的时间、使存储与实时负载保持同步以优化性能,还能通过减少硬件设备数量和能耗、提升资源利用率来降低总体拥有成本(TCO)。

  具体来看,NVMe™ over fabrics (NVMe-oF™)是高性能解耦式存储的关键技术。这项开源技术能在服务器与存储设备间建立更快速、高效的连接,既增强了纵向与横向扩展的灵活性,也进一步提升了资源利用效率。而可组合分解式基础设施(CDI)作为该技术的重要载体,能够实现动态资源的智能分配,尤其为大型企业应对AI场景下的资源波动与高性能需求,提供了架构层面的支持。

  实现存算解耦,AI存储的理想选择

  当然,先进的技术理念最终需要通过具体的产品方案落地,转化为实际价值。西部数据正是这一领域的积极赋能者。作为AI驱动数据经济的核心支柱,西部数据旗下的OpenFlex™ Data24 4000系列NVMe-oF™存储平台,专为真实世界的AI应用而设计,能够满足AI、HPC及云环境高强度工作负载的需求,带来业界领先的敏捷性、高性能与高效能,为构建未来智能基础设施筑牢可持续的数据底座。

存储挑战升级,西部数据如何重构存储基础设施新范式?

  从产品设计来看,OpenFlex™ Data24 4000系列NVMe-oF™存储平台采用紧凑的2U 24盘位设计,通过基于融合以太网的RDMA传输(RoCE)或NVMe over TCP协议实现连接,确保在AI应用场景下为数据提供超高吞吐量和低延迟的传输性能。同时搭载PCIe 4.0高速固态硬盘,并配备与之速度相匹配的高速网络卡,确保数据在存储和网络传输之间能够无阻塞高速传输,充分发挥所有硬件组件的最大性能。

  在运维管理方面,平台内置RESTful API,极大提高了管理效率和系统的可维护性。同时,依托西部数据垂直整合的PCIe SSD、高速网络适配卡及平台设计,既保障了硬件间的高度兼容性与协同性,也大幅降低企业多组件适配的复杂度;N+2风扇冗余设计则省去了对热插拔风扇模块的依赖,进一步强化系统稳定性,有效控制运维成本。此外,全系列产品均提供行业领先的5年有限质保,为企业长期部署AI存储基础设施筑牢可靠保障。

  为了满足企业在AI存储场景下对系统冗余可靠性与单盘性能的差异化需求,OpenFlex™ Data24 4000系列NVMe-oF™ 存储平台有OpenFlex™ Data24 4200和OpenFlex™ Data24 4100可供选择。其中,OpenFlex™ Data24 4200配备双端口SSD,支持PCIe Gen4x2连接与主机I/O到各SSD的主动故障切换,更适合对高可用性有严格要求的企业级AI场景;而OpenFlex™ Data24 4100则采用单端口SSD设计,为每块SSD提供PCIe Gen4x4连接以实现强大的单盘性能,匹配云环境中高可用性非首要需求的场景,帮助客户根据自身需求优化存储架构。

  总体而言,OpenFlex™ Data24 4000系列NVMe-oF™ 存储平台通过高吞吐量匹配GPU算力,显著提升GPU利用率;通过打破存算耦合难题, OpenFlex™ Data24系列支持企业按需独立扩展存储资源 ,从而提升GPU的利用率;并通过简化部署与运维,降低架构复杂度和前期投入,从而有效控制AI基础设施的TCO。

  斩获MLPerf认证:重塑AI存储性能标准

  值得关注的是,西部数据OpenFlex™ Data24 4000 系列 NVMe-oF™ 存储平台已通过MLPerf® Storage V2权威测试。测试结果显示,该平台作为高速网络全闪存储扩展柜(EBOF),能够稳定满足现代AI工作负载的严苛需求,在提供卓越性能与可扩展性的同时,兼顾了经济高效的规模化部署,进一步印证了其在AI存储场景中的实战价值。具体测试表现如下:

  在3D-UNet工作负载测试中,该平台独立运行时实现106.5 GB/s(99.2 GiB/s)的持续读取吞吐量,可让3个客户端节点上的36个模拟H100 GPU达到饱和;与配置PEAK:AIO软件的AI智算服务器配合时,单主服务器+单客户端节点即可提供64.9 GB/s(59.6 GiB/s)吞吐量,满足22个模拟H100 GPU需求。这表明,针对3D-UNet等医疗影像模型的高带宽需求,平台提供的超大吞吐量可支撑海量三维医学影像的并行读取,配合存算分离架构,医院与科研机构可独立扩展影像存储容量,无需担心计算资源浪费,加速疾病诊断模型的训练迭代。

  在ResNet50工作负载测试中,其独立运行时能支持3个客户端节点的186个模拟H100 GPU,展现出高效的存储介质利用率;搭配PEAK:AIO软件后,单节点组合可使52个模拟H100 GPU达到饱和状态。凭借对随机与顺序混合 I/O模式的出色适配,可高效支撑小文件高频访问与快速迭代需求。

  写在最后

  AI时代的竞争,不仅是算力的角逐,更是存储架构与效率的深层较量。当前,AI驱动的数据变革正加速推动企业从数据资源化迈向数据资产化,西部数据OpenFlex™ Data24 4000系列 NVMe-oF™ 存储平台不仅精准回应了AI时代数据存储的挑战,更通过技术落地与产品创新,为企业AI基础设施提供了敏捷、高效、可持续的数据底座,助力企业突破存储瓶颈,充分释放AI技术在各场景中的应用价值。

  可以肯定的是,随着AI技术向千行百业渗透,这种性能卓越、弹性灵活、成本可控的存储基础设施,将成为企业释放AI潜能的优先选项之一。

查看更多内容
正在加载
第三方账号登录
X
发布