说了这么多“小道消息”,那么Kepler到底能带来怎样的性能呢?可能有人会说, 流处理器数量、显存频率、位宽什么都不确定,这根本无法推断。但是我们认为,就像“90%的情报来源于公开信息”这句话样, 事实上只要注意一些NVIDIA已经公开的信息,我们就能轻松地推测Kepler的性能。
首先让我们纵观一下NVIDIA近几代GPU的发展趋势,第一代是G80和G92、第二代是GT200,第三代则为GF100。从单个流处理器效率来说,G92以及其所代表的各种产品效率是高的。比如1GB显存、192个CUDA流处理器的GeForce GTS450的性能相比公版512MB、128个流处理器的GeForce GTS 250性能只高出不到20%,而512MB版本的GeForce GTS 450的性能相比公版的512MB、128个流处理器的GeForce GTS 250综合来看多只强了15%。
在流处理器数量多了50%,频率更高的情况下, 相比早期G80架构的产品,Fermi架构的性能胜出幅度严重不足。甚至人们有理由怀疑,如果在同样流处理器数量的情况下,Fermi架构的产品有可能不是G80架构产品的对手,比如GeForce GT 440、GT430对比GeForce 9600 GSO,两者都是96个流处理器,但前者在频率更高(甚至高出60%)的情况下,绝对3D性能并不见得比后者高多少。
未经证实的GK104 GPU规格表
GeForce GTX 580 | GK104 | |
晶体管数量 | 30亿个 | 32亿个 |
生产工艺 | 40nm | 28nm |
CUDA流处理器 | 512个 | 572个 |
纹理单元 | 64个 | 96个 |
后端渲染引擎 | 48个 | 48个 |
核心频率 | 770MHz | 905MHz |
Shader着色器频率 | 1540MHz | /(与核心频率同频) |
显存频率 | 4000MHz | 4800MHz |
显存位宽 | 384bit | 384bit(256bit) |
显存带宽 | 192GB/s | 230GB/s |
算术性能 | 1.6TFLOPS | 2.0TFLOPS |
接口 | PCI-E 2.0 | PCI-E 3.0 |
几何引擎 | 16个 | 12个 |
设计热功耗 | 244W | 220W |
发布价格 | 499美元 | 399美元 |
因此, 我们可以看到,NVIDIA在进入统一流处理器架构以后,在架构本身自由度、通用计算发展方面做得非常出色,HPC排行榜上屡次出现Telsa的身影, 但是在性能特别是单个CUDA流处理器的效率方面,NVIDIA的产品似乎没有明显提升。出现这样的原因其实不难理解,因为更多的功能和更高的效率很难兼得,就像专用、功能少的固定渲染管线的效率远远高于自由、可编程的流处理器单元一样,这点并不令人意外。
性能提升的秘诀 效率制胜那么,Kepler的目的就呼之欲出了,那就是在进一步发展并行计算的基础上,大幅度提升效率,其实之前NVIDIA公布的一张路线图(本页右下角)早就透露出这一点了。在图中架构为Tesla的T10每瓦特单精度浮点性能的效率为1,架构为Fermi的GF100产品效率提升不到40%,大约在1.3~1.4倍左右,但是Kepler架构会达到4.1倍左右,相比前代产品提升了大约2.92倍。
G92核心堪称GPU发展历史上成功的产品
单精度浮点性能是影响显卡基础性能的一个重要参数。它的性能和3DMark这样的理论3D测试软件有很好的相关性,基本呈正比态势。这样一来,NVIDIA公布的数据就很有参考意义了。当然单精度浮点性能只是GPU性能的一部分,在实际游戏和测试中,考虑到架构更换的因素,在功耗相同的情况下,Kepler能达到到目前Fermi的2~2.5倍左右就已经相当不错了。因此不难推断,在乐观的情况下,Kepler的顶级产品成绩将比目前的Fermi有大幅度提升:250W左右的单核心顶级Kepler的3DMark 11 Extreme成绩高将有可能接近X5000分的水平,至少也能达到X4000分的高度,而这一成绩已远远超出目前Radeon HD 7970 X2700多分的表现;中端显卡则可能从目前X1500分的水平提升至X2500分甚至X3000分左右,也就是说中端显卡就有可能达到目前AMD顶级显卡的水准;低端显卡则可能达到X1000~1500分左右的水平,这将是一次大幅度的性能跃进。
CUDA架构路线图已经透露出Kepler架构的强大性能
所以, 如果和估计相同的话,Kepler将成为NVIDIA又一个胜利的“6”——回想当年的GeForce 6800 Ultra,在性能上直接达到了前代顶级产品GeForce FX 5800 Ultra两倍,就连中端显卡GeForce 6600 GT的性能也了超越了GeForce FX 5800 Ultra,在新游戏中的表现甚至更为优秀。那么Kepler是否能再次上演这一奇迹?它又是通过怎样的方法,将效率大幅提升的呢?或许我们在2012年的第二个季度就能得出答案,请各位继续关注《微型计算机》为您带来的新报道。