骑猪兜风

NVIDIA甩掉高耗低能帽子靠的是这项技术,AMD显卡还没有

骑猪兜风 2016-08-02 10:56:12    200691 次浏览

不论CPU还是GPU,性能与功耗都存在纠结——用户希望性能更强、功耗更低,但同工艺同架构下,性能强就意味着功耗高,这也是厂商不断研发新工艺、新架构的原因。说到GPU性能与功耗,NVIDIA以前一直戴着高耗高能甚至高耗低能的帽子,有些玩家可能对Fermi及之前的大核心还有印象吧,但这几代GPU架构以来,特别是从Maxwell开始,NVIDIA显卡在能耗比上简直开挂,AMD的RX 480性能比GTX 970略高,但14nm工艺的它在功耗上也没占到28nm Maxwell架构多少便宜,而NVIDIA的16nm Pascal显卡更甚,GPU频率都要飙到2GHz了,但功耗控制依然出色,比AMD 14nm显卡更好一些。

NVIDIA甩掉高耗低能帽子靠的是这项技术,AMD显卡还没有

NVIDIA这次用了什么黑科技吗?对于每代GPU架构的变化,NVIDIA虽然会在白皮书中介绍新架构的特点,但通常不会涉及太细节的技术,甚至某些情况下还会否认GPU功能单元的一些变化。

不过RealworldTech网站不一样,他们虽然一年都出不了几篇文章,但一出手就必然是精品,这次他们公布了NVIDIA Maxwell及Pascal架构的一个细节——这两代架构使用了传统桌面GPU没有的贴图光栅化(Tile-based Rasterization,简称TBR)技术。

具体来说,NVIDIA所用的贴图光栅器可以缓冲像素输出,而非传统上那样全屏直接光栅化,为此他们还做了详细的视频,里面介绍了基本的3D渲染过程、DX渲染演示,还有就是对比了AMD、NVIDIA GPU架构执行代码的行为,视频地址在此,时长20分钟,需要爬墙。

如果你对技术介绍不感兴趣,那直接来看这么做的好处也行:

使用贴图光栅化以及芯内缓冲光栅化数据可以减少渲染时的内存带宽占用,提高性能及能效。与他们假设一致的是,他们的测试还证实了NVIDIA改变了贴图大小以便光栅器输出的像素能适应缓存或者芯内缓冲器的固定大小。

就整个显卡行业来说,TBR贴图光栅化技术并不是新玩意,PowerVR架构从1990年代就在用TBDR(贴图延迟渲染)技术了,ARM及高通的GPU也在使用各种类型的贴图渲染技术,不过在桌面GPU上,贴图渲染技术被认为是失败的。1990年代,Gigapixel开发了支持贴图渲染的GP-1 GPU,后来该公司被3dfx收购了,3dfx又被NVIDIA收购了。

PowerVR曾经也有桌面版,其Kyro显卡发布于2001年,后来STMicro取消了这款产品。微软也研究了各种贴图技术,但是最后也被搁置了。值得一提的是,此前我们介绍DX11.1新技术中,里面就有TBDR渲染技术支持。

从以往历史来看,移动GPU的技术往往都是来源于桌面GPU,也就是说桌面GPU下放到移动GPU上,比如可编程渲染器及GPGPU计算都是显出现在桌面GPU上,之后才用于移动GPU。但贴图光栅化技术反过来了,首先用于移动GPU,现在开始影响高性能桌面GPU了,这是一个值得兴奋的转折,未来是否还有其他移动GPU技术被桌面GPU吸收也是值得关注的。

内容加载中