Google昨天宣布旗下的AlphaGo今年5月份将与围棋世界冠军柯洁对战,去年的人机大战已经显示了AI在这方面强大的实力,而此前柯杰与AlphaGo也在网上对战过,结果输了。Google在围棋AI上这么高调实则是展示自家在机器学习、人工智能等新领域的实力,前几天Google还公布了专门为AI运算研发的TPU加速芯片,在AI性能上比GPU加速还要快几十倍,一时间TPU吊打GPU的报道满天飞了。不过宣传吊打GPU势必会惹到专注GPU加速AI的NVIDIA公司,他们表示不服,并扔出了Telsa P40加速卡——老黄没拿出Tesla P100这种核弹说明还是很低调的。
先说说Google的TPU是怎么回事——TPU全称是Tensor Processing Unit(张量处理单元),这是Google为机器学习开发的专用芯片,计算性能会比传统的CPU/GPU组合要强大。根据Google公布的测试结果,TPU要比CPU/GPU加速快上15-30倍,而且能效比还要高达多,这个看要具体的TPU/CPU、TPU/GPU等不同组合了。
Google的TPU性能比传统的CPU/GPU组合要快上几十倍
如果只看Google公布的结果,那么TPU确实在性能及能效上吊打GPU加速了,不过Google宣传自家的AI加速芯片没问题,Google的研究人员其实探讨的也只是技术上的选择问题,不过牵涉到其他家的产品就容易惹来争议了,特别是涉及到了NVIDIA这家怼谁都不怕的公司,因为Google的TPU性能对比用了他们家的Teksa K80加速卡。
日前NVIDIA官方博客就发表了一篇文章回应TPU加速与GPU加速孰好孰坏的问题,这篇文章说的很客气,并没有什么火药味,只不过NVIDIA摆事实讲道理列举了Google的不对之处——你们的TPU对比的其实我们五年前的GPU加速卡。
NVIDIA列举了Pascal一代的Tesla P40加速卡性能
Google之前对比的加速卡是Tesla K80,这是Kepler架构的产品了,发布于2012年,放到今天确实已经落伍了,性能只有Google TPU处理器的1/13也不足为奇。NVIDIA这次扔出的是Tesla P40,是Pascal架构中的加速卡产品,发布于2016年,是Quadro M6000之后第二款完整版GP102核心,3840个CUDA核心,24GB显存,单精度性能12TFLOPS,不过针对AI运算的Int8(FP8,1/4精度)达到了47TFLOPS,NVIDIA表示P40加速卡的加速性能达到了TPU的2倍,带宽则是TPU的10倍,还支持TPU没有的FP32运算。
NVIDIA这篇文章里还是挺客观的,其中也说了不少TPU加速的优点,而双方这次的过节实际上是选择了不同的技术路线,这个问题也不只是TPU与GPU之争,要是扩大起来,Intel的CPU也要表示不服了,毕竟Google对比的CPU还是Haswell时代的Xeon E5-2699 v3处理器。
不过Intel即便不服气也不可能拿CPU来跟Google对怼了,因为CPU这种通用处理器并不适合AI加速运算,所以Intel才买了Altera,后者的FPGA芯片也可以用来做AI加速,Intel要是不服的话大可以拿最新的Stratix 10 FPGA芯片来说话。