MCPLive > 杂志文章 > 无惧7系挑战 Kepler性能预测与分析

无惧7系挑战 Kepler性能预测与分析

2012-02-27radinlove《微型计算机》2012年2月上

开普勒性能大胆预测

说了这么多“小道消息”,那么Kepler到底能带来怎样的性能呢?可能有人会说, 流处理器数量、显存频率、位宽什么都不确定,这根本无法推断。但是我们认为,就像“90%的情报来源于公开信息”这句话样, 事实上只要注意一些NVIDIA已经公开的信息,我们就能轻松地推测Kepler的性能。

谁在拖上代显卡的后腿?

首先让我们纵观一下NVIDIA近几代GPU的发展趋势,第一代是G80和G92、第二代是GT200,第三代则为GF100。从单个流处理器效率来说,G92以及其所代表的各种产品效率是高的。比如1GB显存、192个CUDA流处理器的GeForce GTS450的性能相比公版512MB、128个流处理器的GeForce GTS 250性能只高出不到20%,而512MB版本的GeForce GTS 450的性能相比公版的512MB、128个流处理器的GeForce GTS 250综合来看多只强了15%。

在流处理器数量多了50%,频率更高的情况下, 相比早期G80架构的产品,Fermi架构的性能胜出幅度严重不足。甚至人们有理由怀疑,如果在同样流处理器数量的情况下,Fermi架构的产品有可能不是G80架构产品的对手,比如GeForce GT 440、GT430对比GeForce 9600 GSO,两者都是96个流处理器,但前者在频率更高(甚至高出60%)的情况下,绝对3D性能并不见得比后者高多少。

未经证实的GK104 GPU规格表

GeForce GTX 580 GK104
晶体管数量 30亿个 32亿个
生产工艺 40nm 28nm
CUDA流处理器 512个 572个
纹理单元 64个 96个
后端渲染引擎 48个 48个
核心频率 770MHz 905MHz
Shader着色器频率 1540MHz /(与核心频率同频)
显存频率 4000MHz 4800MHz
显存位宽 384bit 384bit(256bit)
显存带宽 192GB/s 230GB/s
算术性能 1.6TFLOPS 2.0TFLOPS
接口 PCI-E 2.0 PCI-E 3.0
几何引擎 16个 12个
设计热功耗 244W 220W
发布价格 499美元 399美元

因此, 我们可以看到,NVIDIA在进入统一流处理器架构以后,在架构本身自由度、通用计算发展方面做得非常出色,HPC排行榜上屡次出现Telsa的身影, 但是在性能特别是单个CUDA流处理器的效率方面,NVIDIA的产品似乎没有明显提升。出现这样的原因其实不难理解,因为更多的功能和更高的效率很难兼得,就像专用、功能少的固定渲染管线的效率远远高于自由、可编程的流处理器单元一样,这点并不令人意外。

性能提升的秘诀 效率制胜那么,Kepler的目的就呼之欲出了,那就是在进一步发展并行计算的基础上,大幅度提升效率,其实之前NVIDIA公布的一张路线图(本页右下角)早就透露出这一点了。在图中架构为Tesla的T10每瓦特单精度浮点性能的效率为1,架构为Fermi的GF100产品效率提升不到40%,大约在1.3~1.4倍左右,但是Kepler架构会达到4.1倍左右,相比前代产品提升了大约2.92倍。

G92核心堪称GPU发展历史上成功的产品
G92核心堪称GPU发展历史上成功的产品

单精度浮点性能是影响显卡基础性能的一个重要参数。它的性能和3DMark这样的理论3D测试软件有很好的相关性,基本呈正比态势。这样一来,NVIDIA公布的数据就很有参考意义了。当然单精度浮点性能只是GPU性能的一部分,在实际游戏和测试中,考虑到架构更换的因素,在功耗相同的情况下,Kepler能达到到目前Fermi的2~2.5倍左右就已经相当不错了。因此不难推断,在乐观的情况下,Kepler的顶级产品成绩将比目前的Fermi有大幅度提升:250W左右的单核心顶级Kepler的3DMark 11 Extreme成绩高将有可能接近X5000分的水平,至少也能达到X4000分的高度,而这一成绩已远远超出目前Radeon HD 7970 X2700多分的表现;中端显卡则可能从目前X1500分的水平提升至X2500分甚至X3000分左右,也就是说中端显卡就有可能达到目前AMD顶级显卡的水准;低端显卡则可能达到X1000~1500分左右的水平,这将是一次大幅度的性能跃进。

CUDA架构路线图已经透露出Kepler架构的强大性能
CUDA架构路线图已经透露出Kepler架构的强大性能

所以, 如果和估计相同的话,Kepler将成为NVIDIA又一个胜利的“6”——回想当年的GeForce 6800 Ultra,在性能上直接达到了前代顶级产品GeForce FX 5800 Ultra两倍,就连中端显卡GeForce 6600 GT的性能也了超越了GeForce FX 5800 Ultra,在新游戏中的表现甚至更为优秀。那么Kepler是否能再次上演这一奇迹?它又是通过怎样的方法,将效率大幅提升的呢?或许我们在2012年的第二个季度就能得出答案,请各位继续关注《微型计算机》为您带来的新报道。

分享到:

用户评论

共有评论(1)

  • 2012.02.27 16:44
    1楼

    感觉这种预测有些太过乐观了!

    (1) (1) 回复

    w10024337

    2012.03.06 09:20

    其实感觉这次NV落后于AMD三个多月的产品发布进度,真怀疑NV是不是遇到什么技术瓶颈了。开普勒有没预想的那么强悍现在还不好说,但如果晚了那么多才发布,还拼不过AMD7900系列,那NV就真砸了自己招牌了。作为NV粉丝,对开普勒还是有信心的!

用户名:

密码: