【IT168 资讯】在2016年12月,AMD就曾对外预览了Radeon Instinct加速卡。新一代GPU服务器加速卡包括Radeon Instinct? MI25、Radeon Instinct MI8和Radeon Instinct MI6,它们结合AMD开放式ROCm 1.6软件平台,将大大提高性能,效率并且易于实施,从而加速深度学习推理,加速训练机器智能。
北京时间6月21日,AMD正式对外推出Radeon Instinct加速卡,包括MI6、MI8和MI25三个型号,并提出将引领直觉式计算时代。
规格方面,低端AMD Radeon Instinct MI6采用Ploaris 10核心,提供5.7TFLOPs以及224GB/s显存总带宽,功耗低于150W,采用单槽被动式散热。中端AMD Radeon Instinct MI8采用Fiji核心,拥有8.2 TFLOPs 、512GB/s带宽,低于175W功耗,采用了SFF规格,同样是被动式散热。高端AMD Radeon Instinct MI25 采用最新一代VEGA核心,FP32浮点性能高达12.5TFLOPS,FP16半精度性能高达25TFLOPS,功耗低于 300W。
具体而言,Radeon Instinct MI25 加速卡,基于"Vega" GPU 架构,采用14nm FinFET工艺,将成为世界上大型机器智能和深度学习数据中心应用的终极训练加速卡。MI25内建64个计算单元(4096个流处理器),在被动式冷却的单GPU服务器卡中提供优异的FP16和FP32性能,具有24.6 TFLOPS的FP16或12.3 TFLOPS的FP32峰值性能。凭借16GB超高带宽HBM2 ECC GPU内存和高达484 GB/s 内存带宽,Radeon Instinct MI25针对大规模并行应用进行优化,满足大型数据集机器智能和HPC级系统工作负载需求。
Radeon Instinct MI8加速卡,利用"Fiji"GPU架构的高性能,高能效,是一种小尺寸HPC和推理加速卡,具有8.2 TFLOPS峰值FP16 | FP32性能,板载功耗小于175W,内建4GB高带宽内存(HBM)和512-bit内存界面。MI8非常适合机器学习推理和HPC应用。
Radeon Instinct MI6加速卡,基于广受赞誉的"Polaris"GPU架构,是一种被动冷却的推理加速卡,其峰值FP16|FP32性能为5.7 TFLOPS,峰值板载功耗为150瓦,内建16GB超快速GDDR5 GPU内存,256-bit内存界面。MI6是一种多功能加速卡,适用于HPC和机器学习推理以及边缘训练部署。
AMD表示将于近期向合作伙伴出货Radeon Instinct加速卡,合作伙伴包括Boxx,Colfax,Exxact Corporation、Gigabyte、Inventec和Supermicro等厂商,并从2017年第三季度开始驱动这些厂商的深度学习和HPC解决方案。
Radeon Instinct加速卡完全由AMD自己设计制造,支持MxGPU SRIOV硬件虚拟化 (业界首款也是唯一支持SR-IOV PCIe虚拟化标准且基于硬件的虚拟化GPU),完全被动散热。
AMD Radeon Instinct目前主要锁定云端计算、金融服务、科研平台上,包括那些诸如能源、生命科学此类的大规模计算项目上。Radeon Instinct硬件配合上之前发布的Radeon Open Compute Platform底层,还有在此基础上开发对应的机械学习、深度学习软件。