11月20日消息,据外媒报道,IBM和AMD宣布合作部署AMD Instinct MI300X加速器,作为IBM Cloud上的一项服务。该产品预计将于2025年上半年推出,旨在提高通用AI模型的性能和能效,以及面向企业客户的高性能计算(HPC)应用。此次合作还将支持IBM的watsonx人工智能和数据平台中的AMD Instinct MI300X加速器,以及红帽®企业Linux®人工智能推理支持。
IBM和AMD将合作在IBM Cloud上提供MI300X加速器作为一项服务,以支持利用人工智能的企业客户。具体来看:
1、支持大模型推理:AMD Instinct MI300X加速器配备192GB高带宽内存(HBM3),支持最大模型推理和微调。大内存容量还可以帮助客户用更少的gpu运行更大的模型,从而潜在地降低推理成本。
2、增强的性能和安全性:在IBM Cloud Virtual Servers上为VPC提供AMD Instinct MI300X加速器作为服务,以及通过IBM Cloud Kubernetes service和IBM Red Hat OpenShift在IBM Cloud上的容器支持,可以帮助运行AI应用程序的企业优化性能。
3、对于生成式AI推理工作负载,IBM计划在IBM的watsonx人工智能和数据平台中支持AMD的本能MI300X加速器,为Watsonx客户提供额外的人工智能基础设施资源,以便在混合云环境中扩展其人工智能工作负载。此外,红帽企业Linux AI和红帽OpenShift AI平台可以使用MI300X加速器上的InstructLab校准工具运行Granite系列大模型。
据悉,搭载AMD Instinct MI300X加速器的IBM Cloud预计将于2025年上半年全面上市。