艾米丽.拉克瓦:平衡与妥协 GTX560Ti能否找回Ti系荣誉

来源:百度文库 编辑:九乡新闻网 时间:2024/04/28 02:34:07
今天我们发布“CBS之眼探索与发现”的第二篇文章,之所以选择在这个时间点发布,因为文章的主要分析对象是 Geforce GTX 560 Ti显卡,这是NVIDIA在GF104芯片发布半年之后推出的增强版GF110芯片。而选择Ti作为后缀则显示了NVIDIA希望这款芯片能够长久保持 优势的信心。但是现在的Ti已经不能和2002年的Geforce 4800 Ti相比了,NVIDIA并没有在这款芯片上使用最新的技术,而是在不断平衡或者说不断妥协……
GTX560Ti诞生背景
2002年初NVIDIA正式发布了开发代号为NV25的图形芯片,取名为Geforce 4800 Ti,这款产品在当时获得了前所未有的成功,也极大的打击了对手ATI在中高端市场上的火热销售的Radeon 8500、7500系列显卡。Ti系列不仅借助其先进的技术赢得了消费者的认同,更为NVIDIA收复了大量市场份额。Ti系列塑造了多重辉煌,特别是 Geforce Ti4200显卡在几年后仍然热销。
时隔9年,NVIDIA再次恢复了Ti(中文名:钛)这一名称在显卡产品中的使用,NVIDIA想要达到什么目的,NVIDIA希望厂商、 市场和用户如何面对这款产品,为什么GF104、114核心要加大每个CUDA核心的发射端和纹理资源,NVIDIA面对目前的图形市场发展有哪些无奈, 这些问题都会成为我们分析的重点。当然后文的测试部分我们会放出一些GF114核心对比GF104核心的性能优势。
在当年GeForce 4 Ti 4000产品中,NVIDIA在原有的nfiniteFX图形架构引擎上做了相当完整的改进,并命名为nfiniteFX II引擎。其中在原来有的一个Vertex Shader的基础上,又增加了第二并行运行的Vertex Shader,即双Vertex Shader,因此可以使芯片的顶点处理速度加快一倍,使困惑图形界很久的皮毛渲染成为了可能。在人们对Shader单元发展还还有疑惑的时 候,NVIDIA不但提升了Vertex Shader性能而且也提升了Pixel Shader版本从1.1到1.3,这是一种毫无疑问的技术进步。

缔造辉煌的GeForce 4 Ti NV25芯片
随着微软不断提升其图形API也就是DirectX版本,业界期待一款并行计算和可编程能力极其强大的GPU,因为已经有很多程序员和图形设计师体会到了 微软DirectX 11在技术特性方面的转向,尽管家用机平台图形引擎由于更新缓慢等问题停滞在DirectX 9.0时代,但是PC游戏和图形业界的前进速度已经远远超乎想象。
回到2010年初,尽管我们确信Fermi架构代表了先进的技术发展方向,但是初期GF100核心表现令人不 免失望,或许是期望越高失望越大,在DirectX 9游戏中Fermi架构没有建树,DirectX 10游戏中又不能大幅度领先晶体管数仅有其66%的RV870核心……Fermi似乎面临到很多问题,你怀疑过这款核心的未来发展吗?

基于40nm工艺制造的GF114-400-A1核心
2010年7月,一款删减版的Fermi核心诞生了,它正是拥有19.5亿个晶体管的GF104核心,虽然流处理器剩下366个,显存位 宽等资源都变小了,但是它凭借出色的性价比和性耗比获得了市场的认同,甚至厂商和超频用户发现在高频下运行的GTX460显卡可以获得与GTX480几乎 相当的游戏性能。最后的市场反应是:精简版产品获得了认同,而代表Fermi架构全部特性的GF100却成为高功耗高发热的代名词。
北京时间2010年1月25日22点,Geforce GTX560 Ti发布了,如果说GTX580补全了GTX480的遗憾,那么GTX560 Ti则大幅度提升了GTX460的性能并带给用户更多选择,虽然价格较高达到2000元人民币,不过产品性能和定位确实带来了芯片厂商、板卡厂商、渠道商 的多赢局面。不过和9年前取名Ti不同,GTX560Ti和上代产品相比实在没有什么值得称道的技术,不过Ti系列的命名规则让我们体会到NVIDIA希 望制造一款长期控制市场的GPU产品。
GF114从何而来,有何提升
通过ZOL显卡频道昨天的芯片级首测,我们了解到GF114核心相对与GF104核心打开了屏蔽的一组SM单元并提升了频率,不过这颗芯片还是让我们有点 意外,毕竟它的超频能力太强劲,且相对与GF104的发热功耗拐点有较大区别。不过GF114到底从何而来,现在的确是个问题,它是完整版的GF104还 是NVIDIA重新优化设计的芯片?
目前流传作为广泛的说法是GF114核心和GF110核心一样,经过了彻底推倒重来的EDA设计,我们之前在GF110核心中分析过这些问题。如果经过了EDA设计则芯片功耗下降,工作频率带上升或加宽,这就是显卡玩家所说的低温运行、超频能力强劲等优势。

GeForce GTX 560 Ti公版显卡
不过第二种说法相对保守很多,这种观点的坚持者认为GF114是没有经过屏蔽的GF104芯片,也就是说NVIDIA没有做任何改进只是在今年年初推出了这一批完整版的384SP芯片。毕竟GF104芯片在性耗比方面已经很优秀,优化空间较小。
对于送测产品或者高端GTX560Ti产品的芯片需求,NVIDIA挑选了一些电气性能优异的GF104产品作为GTX560Ti的核心。在我们没有获得稳定详细资料之前,关于GF114芯片的来历问题还是不评论为好。
下面这张表格列出的是GF104和GF114芯片的特性对比:
GeForce GTX 560 Ti 显 卡 特 性 提 升 对 比
显卡型号GeForce GTX 560TiGeForce GTX 460特性对比
GPU代号GF114GF104—
GPU工艺40 nm40 nm—
GPU晶体管19.5 亿19.5 亿—
着色器数量384336提升14%
ROPs数量3232—
纹理单元数量6456提升14%
核心频率822 MHz675 MHz提升21%
着色器频率1645 MHz1350 MHz提升21%
理论计算能力1.89 TFLOPs1.36 TFLOPs提升38%
等效内存频率4008MHz3600 MHz提升11%
内存位宽256 bit256 bit—
内存带宽128.0 GB/s115.2 GB/s提升11%
内存类型GDDR5GDDR5—
内存容量1024 MB1024 MB—
DX版本支持1111—
通用计算接口CUDACUDA—
在补全384个流处理器和8个TMU纹理单元之后,GTX560Ti选择了继续提升频率,我们看到相对与GTX460核心和显存频率分别 提升了21%和11%,而综合浮点吞吐能力则提升了38%,可以说在并行度和频率方面的提升为GTX560Ti塑造了一个满意的市场定位,或者说的通俗一 些可以卖出更好的价格。
设计一块可制造性较高的芯片,是基于多种考虑后的结果,当GPU芯片可制造性提高之后,良品率、性耗比等指标会提升,利好GPU芯片厂 商。而TDP等指标则会下降,最终带来显卡成本下降,利润上升,利好显卡制造厂商。GF104和GF114在这方面几乎达到了目前我们所见到的GPU中表 现最好的,相关产品在市场上颇受追捧,单价利润都不低,利好渠道商。
两次平衡,两次妥协
事实上GF104并不十分完美,但是它的缺憾恰好造就了这颗芯片在3D游戏方面的高性价比和性耗比。有些问题在GTX460发布之时就应 该摆出来讨论,但是这些浮华的测试成绩掩盖了太多人的视线,貌似GTX460可以一统天下了。而GF104和GF114芯片偏重纹理填充、压抑 Shader功能的设计思路实际上是对整个图形业界现状的妥协,或者说为了设计更符合现在图形编程环境。

GF100/110与GF104/114 SM对比
两 款 Fermi 架 构 核 心 全 规 格 对 比
Graphics CoreGraphics CoreGF110GF114总体下降
Processing UnitsGraphics Processing Clusters4250%
Streaming Multiprocessors16850%
CUDA Cores51238425%
Texture Units6464—
ROP Units483233%
OtherMemory Interface384-bit256-bit33%
L1 Cache64 KB
(16 KB + 48 KB)64 KB
(16 KB + 48 KB)—
L2 Cache768 KB512 KB33%
Warp321650%
让我们通过对比来看下GF100/110和GF104/114中分别SM拥有功能模块的比例。抛开 GF100/110和GF104/114的整体规格不看单比SM规格,GF104/114 SM的功能模块数量相比GF100/110 SM的功能模块数量只多不少,也就是说GF104/114单个SM的性能要强于GF100/110单个SM,但是GF100/110拥有16个SM,而 GF104/114只有8个,因此效率受到较大影响。
GF100/110 SM vs. GF104/114 SM
Graphics CoreGraphics CoreGF100/110GF104/114总体提升与对比SP平均资源提升
SMCUDA Cores3248提升50%—
Warp Scheduler22—降低50%
Dispatch Unit24提升100%提升25%
SFU48提升100%提升25%
LD/ST16 个16 个——
INT Unit3248提升50%—
FP UnitFP32:32
FP64:16FP32:48
FP64:24提升50%—
Texture Unit48提升100%提升25%
总体对比而言,我们可以看到每个SM中CUDA Core数量和Texture Unit数量均有大幅增加,这都会增加SM的3D计算能力,从而让用户在游戏体验上获得更好的效果。不过相反每个CUDA Core和Texture Unit分得的各类Cache有所减少,这应该是NVIDIA GPU架构工程师在性能、晶体管平衡取舍上得出的比例。
以上特性我们可以总结为,NVIDIA在设计GF104/114时因为晶体管数量所限,减少了SP数量,降 低了运算并行度,但是为每个SP配备了更多的纹理和发射端等资源,特别是纹理单元在SM中的翻倍让GPU更加适应当前的图形环境。不过在基于GPU的高性 能计算测试中,我们会明显发现GF104/114的这种思路导致性能较幅度下降。
GTX560Ti与GF114芯片概况
在显卡设计环节上,由于GF114芯片流处理器达到了384个且运行频率更高,所以需要更好的供电、散热器来辅助。本次 GTX560Ti主要采用了4+1项供电和3热管铜底散热器,毕竟面对一款发热并不是很高的GPU核心,不需要在板卡设计方面投入太多成本。

4+1相供电设计

三热管散热器特写
在这个环节,我们使用了常用的GPU-Z软件和Furmark1.8.0软件来测试这款显卡的基本信息和满负载温度曲线。这GPU-Z软 件可以帮助我们最直观的了解一款GPU的基本概况,EVEREST软件作为经典的信息识别软件,可以识别GPU基本参数特别是通用计算方面的特性。

GPU-Z第一屏可以显示显卡的GPU规格和额定频率等信息,而第二屏则可以显示显卡在低功耗模式下的自己降频特性,如果显卡不具备节能特性,则在桌面模式下不会自动降低功耗。

我们看到这款公版GTX560Ti显卡的额定频率为823/4000MHz,高于GTX460公版产品675/3600MHz。节能方面GPU频率在低功耗下能过下探到50MHz,显存达到135MHz(原始频率),这一点和GF104芯片完全一样。

EVEREST软件最新版并未成功检测GF114芯片详细信息,所以我们选择了“GPGPU”页面来查看GPU通用计算特性。我们看到GF114和GF104一样支持32/64位原子操作、双精度性能和Warp Vote特性。
性能测试的硬件、软件平台状况
测试系统硬件环境
性能测试使用的硬件平台由Intel Core i7-870 3.5GHz、GIGABYTE GA-P55-UD4主板和2GB*2双通道DDR3-1600内存构成。细节及软件环境设定见下表:
测 试 平 台 硬 件
中央处理器Intel Core i7-870 OC3.5GHz
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存 )
散热器Thermalright Ultra-120 eXtreme
( 单个120mm*25mm风扇 / 1600RPM)
内存模组Apacer 猎豹二代双通道套装/PC3-12800
(SPD:1757 9-9-9-24-1T)
主板GIGABYTE GA-P55-UD4
(Intel P55 + ICH10R Chipset)
显示卡
NVIDIA 产 品
GeForce GTX 560 Ti 1024MB
(GF104 / 1024MB / 核心:823MHz / Shader:1646Mhz / 显存:4008 Mhz)
GeForce GTX 460 1024MB
(GF104 / 1024MB / 核心:675MHz / Shader:1350Mhz / 显存:3600 Mhz)
GeForce GTX 580 1536MB
(GF110 / 1536MB / 核心:772MHz / Shader:1544Mhz / 显存:4008Mhz)
GeForce GTX 480 1536MB
(GF100 / 1280MB / 核心:700MHz / Shader:1401Mhz / 显存:3696 Mhz)
AMD 产 品
Radeon HD 6870
(Barts / 1024MB / 核心:900MHz / Shader:900Mhz / 显存:4200 Mhz)
Radeon HD 6850
(Barts / 1024MB / 核心:775MHz / Shader:775Mhz / 显存:4000 Mhz)
Radeon HD 5850
(RV870 / 1024MB / 核心:725MHz / Shader:725MHz / 显存:4000MHz)
Radeon HD 5830
(RV870 / 1024MB / 核心:800MHz / Shader: 800MHz / 显存:4000MHz)
Radeon HD 5770
(RV840 / 1024MB / 核心:850MHz / Shader: 850MHz / 显存:4800MHz)
硬盘Hitachi 1T
(1TB / 7200RPM / 16M缓存  / 50GB NTFS系统分区)
电源供应器AcBel R8 ATX-700CA-AB8FB
(ATX12V 2.0 / 700W)
显示器DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)

技嘉P55-UD4 GIGABYTE GA-P55-UD4

Apacer 猎豹二代双通道套装/PC3-12800

AcBel R8 ATX-700CA-AB8FB

Thermalright Ultra-120 eXtreme
我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,电源供应器、CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供。
为保证系统平台具有最佳的稳定性,此次硬件评测中所使用的操作系统均为Microsoft Windows 7 正版授权产品。使用Windows 7正版软件能够获得最好的兼容性以及系统升级更新服务。

用户在体验或购买安装Windows 7的操作系统时请认准所装系统是否已经获得正版授权许可!未经授权的非正版软件将无法获得包括更新等功能在内的Windows 7服务。
测试系统的软件环境
操 作 系 统 及 驱 动
操作系统
Microsoft Windows 7 Ultimate RTM
(中文版 / 版本号7600)
主板芯片组
驱动Intel Chipset Device Software for Win7
(WHQL / 版本号 9.1.1.1125)
显卡驱动
AMD Catalyst for Win7
(WHQL / 版本号 10.12)
NVIDIA Forceware for Win7
(WHQL / 版本号 265.56)
桌面环境
2560*1600_32bit 60Hz
测 试 平 台 软 件
3D合成
测试软件
3Dmark Vantage
Futuremark / 版本号1.2
DirectX 11
理论测试项目
DX11 SDK Test:Sub D11
Microsoft / 版本号 Demo
DirectX 11 SDK Nbody Gravity
Microsoft / 版本号 Demo
HDRToneMapping CS11
Microsoft / 版本号 Demo
OIT 11
Microsoft / 版本号 Demo
MultiThreadedRendering11
Microsoft / 版本号 Demo
基准性能测试
GPCBenchMarkOCL
HPC Tech / 版本号1.1
辅助测试软件
Fraps
beepa / 版本号 3.2.3
各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。
本文导航
Geforce 4800 Ti发布
GF114从何而来,有何提升
两次平衡,两次妥协
GTX560Ti与GF114芯片概况
性能测试的硬件、软件平台状况
3Dmark Vantage特性测试
SubD11曲面细分性能衰减
3项 DirectX 11 SDK特性测试
多线程渲染SDK项目测试
GPCBenchMark整体与子项得分
Folding GPU分布式计算
GF104/114为什么要诞生