缩短AI开发周期,这台POWER9真的很智能

  本周,IBM正式推出了基于POWER9处理器的新一代Power Systems服务器。全新POWER9系统专为计算密集型人工智能工作负载而设计,可将深度学习框架的训练时效提高近四倍,从而帮助企业以更快的速度更准确地部署人工智能应用。

  基于全新POWER9的第一款服务器就是AC922 Power Systems,它也是首批嵌入PCI-Express 4.0、新一代NVIDIA NVLink及OpenCAPI的系统。据IBM官方资料显示,凭借这几项技术的结合,能够让AC922加速数据传送超出基于PCIe Gen 3的x86系统I/O 性能9.5倍 。

  POWER9问世,美国能源部和谷歌助阵

  POWER9在北京正式发布

  时隔多年,IBM Power平台终于“更新”了,新产品也将关注重点转向了AI。IBM大中华区科技合作部副总裁Mary Coucher在接受采访时表示:POWER9是针对目前人工智能时代而设计的产品,我们在设计这个产品的整个过程中都考虑到AI,也证明了IBM的技术远见。性能方面,跟主流x86相比能够提供2倍的线程, 5倍I/O带宽;CPU和GPU之间的相关内存共享提升至2TB,此外还是业内第一个使用PCIe Gen 4技术的,速度比今天基于PCIe Gen 3的x86要快2倍。

  怎么样?硬指标够硬吧,对于IBM在开发最新POWER技术方面的进展,同为OpenPOWER基金会成员的谷歌也感到非常兴奋。POWER9的OpenCAPI总线及其大储存容量为Google数据中心的创新提供了更多的机会。

  此外,POWER9也是美国能源部Summit及Sierra超级计算机的核心,这两台超级计算机建成后将成为世界上性能最强的数据密集型超级计算机。

  AC922,为人工智能而生

  IBM杰出工程师 大中华区硬件系统部首席技术官李永辉表示:这里可以看到的,POWER9的发布并不是一个单纯的芯片的发布,而是很多领域上的创新的开启,包括人工智能领域的创新,包括高性能计算的创新,包括一些业务上的创新等等。

  AC922是全世界第一款支持新一代PCIe第四代技术的服务器,它融合了CAPI2.0、OpenCAPI I/O加速技术,还可以支持最新的NVLink连接GPU与CPU的独有加速技术。所以POWER9不是单单是一颗处理器,而是IBM在很多领域的创新成果。Accelerated Computing(AC)是代表计算加速的平台,我们可以看到未来是朝加速技术和普遍性CPU共融的环境共同发展。

  在POWER9最多支持24颗核心,芯片本身工艺紧密程度比上一代增加了一倍。可以看到POWER9不单单是内核的内部功能的提升,同时间它真的在推动一个加速计算的新时代,加速计算也是新时代的一种计算机的架构。新一代I/O总线的增强,可以帮助客户开发一些他自身的硬件加速技术,采用CAPI或者OpenCAPI的技术实现I/O设备与CPU链接及共享内存空间,同时提供业界首个PCIe第四代I/O扩展能力,为新一代I/O扩展卡性能带来进一步提升。

  此次IBM发布的第一款产品是AC922,除了双路40核之外,它可以选择最多6个NVIDIA Tesla V100的GPU,这也是当今业界最高端的GPU。IBM提供的这一款机器在小小的2个U空间最多能封装6个GPU,堪称一绝。这个能力也被美国能源部橡树岭国家实验室所看重,因此才会拿它去构建超算平台。

  据李永辉介绍,AI测试方面,在人工智能图像分类测试中,采用POWER9与x86平台对比,在同样采用四个NVIDIA的V100的GPU时,POWER9跑出来的结果比x86要快最多3.8倍。这项测试就是用人工智能的方式,将高精度图像进行深度学习和分类,当培训完机器以后,就可以用深度学习出来的结果进行图像分类了,主要测试处理速度。IBM POWER9能够有效帮助客户提升在人工智能深度学习过程当中的速度,减少训练时间。

  缩短AI开发周期,这台POWER9真的很智能

  为什么IBM会强调AI?原因是我们看到在过去可能一两年内,这个领域做了很大的改变, IT正进入一个新时代, IBM称之为认知时代。在这个认知时代里面,新的平台是需要做到一些认知的能力,这些认知的能力包括所谓理解能力、推理能力、学习能力、交互能力,这些能力都是需要通过GPU来实现的。比如做图像识别、语音识别等等。

  谈到POWER9在人工智能方面的增强,李永辉表示,一方面是水平的扩展,因为今天我们看到AI很多的开源应用只局限在一台机器跑,IBM有一个能力可以透过分布式深度学习(DDL)技术扩展到多台机器。IBM也在12月初发布了一个Deep Learning Impact软件,利用Spark大数据的技术,可以把人工智能的框架水平扩展到多台机器上去跑,同时间也提供了一些工具去帮用户做Hyper-parameter Search超参挑选。

  举例来讲,分几十层的神经元网络无论做人脸识别、语音识别还是文本识别,在这个过程里面每一层的神经网络的参数要设什么参数,设不好是学习不了。IBM的软件能力是可以通过Hyper-parameter Search能力,帮用户在GPU这个机器里分组学习最好的超参告诉给你,这样可以加快人工智能的训练,缩短AI应用开发的时间。

  就像IBM所述,人工智能时代不仅仅需要强大的处理能力和前所未有的速度,还需要创新型公司所构建的开放式生态系统提供技术和工具,而POWER9就是其中之一。

第 1 /  10 页
点击查看余下全文