骑猪兜风

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力

骑猪兜风 2016-04-06 09:56:15    201380 次浏览

AMD、NVIDIA下一代显卡争霸战今天拉开了帷幕,因为GTC大会上NVIDIA终于正式发布了Pascal显卡的旗舰Tesla P100,虽然今年1月份的CES展会上NVIDIA发布的Drive PX2自动驾驶平台使用的也是Pascal显卡,但当时的发布只是象征意义的,现在人们才首次看到了GP100显卡的真容——拥有3584个CUDA核心,153亿个晶体管,16GB HBM2显存,核心频率高达1328MHz,浮点性能10.6TFLOPS。

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力
NVIDIA发布首款Pascal架构的高性能HPC显卡Tesla P100(图片来源于Anadntech网站

对于Pascal架构,我们之前陆续报道过了很多内容,这次的真·Pascal显卡有些规格与爆料相符,不过很多内容也是出乎意外的,可以确定的内容是16nm FinFET工艺、16GB HBM 2显存、4096bit位宽以及支持NVLink总线等,不过GP100的CUDA核心数比之前曝光的要少很多,只有3584个,比目前GM200核心的3072个没高出多少,不过GP100的双精度CUDA单元暴增,而且核心频率异常凶猛,基础频率就有1328MHz,加速频率1480MHz,比很多Maxwell显卡的超频频率都要高,这可是153亿晶体管的大核心啊!

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力
GP100显卡核心

GP100核心规格

详细规格来看下官方资料,如下图所示:

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力
GP100详细规格

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力
Anandtech网站做的另一份表格

对比这两份表格之后,我们可以看出GP100核心确实是为高性能计算而生的,虽然3584个CUDA核心相比目前GM200的3072个提升不多,但在FP64双精度单元上,GP100核心总计拥有1792个CUDA核心,相当于FP32单精度的1/2,相比之下GM200只有96个,所以其FP64双精度性能高达5.3TFOPS,而GM200核心只有0.213TFLOPS,GK110核心也只有1.68TFLOPS,绝对是碾压之态。

GP100第二点变化是升级了显存架构,从之前的GDDR5变成了HBM 2,从图片上看也是堆栈了4颗HBM 2显存,等效位宽4096bit,不过频率1.4Gbps而非HBM 2显存应有的2Gbps,因此带宽只有720GB/s,并没有达到之前所说的TB/s级别,只不过720GB/s的带宽已经远远超过了之前GM200/GK110核心的240-288GB/s带宽了。

至于容量,目前HBM 2显存量产的是4GB颗粒的,因此GP100的显存容量也是16GB,与我们之前分析的一致,而32GB的超大容量还得等到8GB HBM2显存芯片量产才有戏。

GP100核心更让人惊讶的地方是核心频率,Pascal使用了更先进的16nm FinFET工艺(之前说高性能的16nm Plus工艺),新工艺带来的好处不仅是功耗和发热降低,核心频率也大幅提升了,之前GK100/GM200这样的大核心GPU频率通常在1GHz内,甚至为了控制功耗还会降低到500-700MHz左右,但GP100基础频率就有1328MHz,加速频率1480MHz,这简直是bug,理论上仅仅核心频率提升就差不多能把性能提升一倍了。

这还是GP100大核心的表现,现在更让人期待GP104主流核心的表现了,后者晶体管规模更小,功耗更低,按照这个表现,核心频率不得起步就是1.5GHz了?

GP100核心架构

核心架构方面,GP100核心总计使用了56组SM单元,28组TPC单元,依然是每组SM单元64个CUDA核心,因此总计3584个CUDA核心,但不同以往的是这次的双精度单元回来了,每组SM单元中还有32个FP64双精度单元。

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力
GP100核心的SM单元架构

除了CUDA单元数量增加,GP100为了适应高性能计算还大幅增加了缓存及寄存器大小,L2缓存从GM200的3072KB增加到了4096KB,每组SM单元的寄存器文件大小还是256KB,但总数从6144KB增加到了14336KB。

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力
GP100核心架构示意图

GP100还有一个重要技术就是NVLink总线,其带宽远高于PCI-E总线,不过这个更偏向HPC领域,对消费级市场影响最大的可能就是在NVLink总线支持下,8-Way SLI显卡互联也是可能的。

以上是GP100核心的一些简要信息,GP100显卡主要面向专业领域,对应的消费级产品应该是GTX Titan X下一代了,但目前还没有什么消息,即便有也会贵的惊人。主流市场的GP104核心还要等到今年6月份电脑展,耐心等待2个月吧。

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力

NVIDIA发布Tesla P100显卡:Pascal降临,见识GP100的恐怖威力
附送官方核弹



关注超能网微信公众号exp2006,原创科技资讯精彩不断。

内容加载中