|
关键字之四:R520
与R520相关的自然是X1000系列显卡,R520是其旗舰产品X1800的核心芯片代号,而X1600和X1300采用的是RV515,RV530芯片。
虽然ATI在今年开始也一直在不断挖掘R420/480架构的潜力,包括采用新制程、细分型号、调整价格,但这一切并未从根本上动摇nVIDIA的市场根基,特别是不支持DX9.0C一直是ATI产品的最大硬伤,ATI的粉丝们一直期盼R520的到来!在屡次跳票后,ATI终于在10月5日发布代号为R520的RADEON X1800系列。RADEON X1800系列此次终于正式支持SM3.0规格,不过规格仍令玩家们大失所望:仅拥有16条像素管线、8条顶点管线。不过除了凭借先进的90nm制程大大提升R520的核心频率外,ATi还在R520引入了经过改良的Ultra-Threaded Pixel Shader Engine,提升了核心的渲染能力。其实传统的Pixel Shader架构设计造成大量的延迟及浪费运算周期,另一个主要的浪费在动态分支Dynamic Branching的执行能力上,这更是Pixel Shader 3.0中常用的指令,令Pixel Shader程序可以执行不同的分支或是根据运算而循环执行,而R520核心则会进一步优化Dynamic Branching的运算。因此ATi宣称其R520核心比上代有效使用率提升达90%以上。

一年来不断在跳票的R520核心
同时在R520中,ATI引入效能更高的环路显存架构。 这种环状的总线在理论上可以减小内存的延迟。同时,这样的内存控制器使得制造主板时需要将内存的位置分散于GPU的四周,这样一方面提供了很好的速度,一方面又提供了很好的散热性能。ATI声称,这种全新的内存控制技术和增强了的缓存以及优良的算法相结合,会使从前的那种对显存带宽的极度依赖的情况大为改观。虽然引入了众多创新的技术,X1800XT性能仍略逊色于NVIDIA的GeForce 7800 GTX,但你不要忘记了这是16条像素管线与24条像素管线之间不对等的对抗!从这个意义来说,X1800完全称得上划时代的产品,它开始脱离了仅依靠渲染管线数量和晶体管规模来获得高性能的机械做法,而是通过对架构进行深层次的改良,从而在执行效率上获得突破。

在10月份终于迎来了X1000系列的正式发布
ATI给X1800设计了一个大规模的、能同时读写(多端口)、高带宽的通用寄存器堆,所有的连接总线都是FP32位宽,确保Pixel Shader在任何时候都能高效地完成FP32精度计算。
ATI的Ultra-Threading设计还能够提高Pixel Shader 3.0动态分支的性能。ATI X1000在跑分支程序的时候,能够把屏幕分成很多个4X4的小块来分别处理,在这样小的一个像素块里碰到两条不同的分支的机会就非常小,降低了出现SI2D的机会。如果跑同样的两条分支,在执行if/end/endif分支指令的时候,“传统架构”需要花20个周期才能完全跑完,而ATI的X1000系只需要14个周期。
当然这样的架构优势在现有的多数游戏中体现不出来。
X1000的Render back end在执行FP16的时候还能够做多取样抗锯齿,而这是目前NVIDIA的产品所不具备的。
不过需要注意的是,目前的DirectX9.0c并不支持对浮点Render Target做多取样抗锯齿,因此除非DirectX9升级,否则这个特性可能无法在D3D游戏中使用。不过在OpenGL中,这个特性将完全可以实现。
现阶段最有用的当然是高效的内存控制方式了。
在RADEON X1000系上,ATI重新起用了32位内存控制器,在RADEON X1800上,有8个32bit内存控制器,内存带宽使用效率恢复到接近GeForce 3时代的水准。为了充分利用高速内存的优势,ATI给RADEON X1000系设计了一个新式的环网总线架构。两条双向个256位的环路,负责把内存中的资料交付给贴图单元、顶点着色器等单元(这些对象ATI称作是内存客户端),而资料的写入操作则依然会被路由到Crossbar上来实现。采用了这样的环路读取、Crossbar写入的设计后,内存总线的频率可以比以前的产品提高一倍,使得X1000系可以充分利用先进的内存技术。
此外ATI还提到,X1000系的内存仲裁器能够由驱动程序控制,可以透过驱动程序的CATALYST A.I(智能参数设定),为特定的应用程序设定仲裁优先次序,让内存控制器优先处理最迫切、对性能影响最大的数据请求。
RADEON X1800的纹理cache、z/stencil cache、色彩缓存cache上就采用了全相联的cache技术,cache不再只是映射到特定一个或者某几个的内存地址,而是任意空闲的内存。ATI表示,在任何给定的时钟频率下的内存带宽敏感型应用中(例如在高分辨率下打开全屏抗锯齿和各向异性过滤),X1800的性能都能比采用前提升25%。
RADEON X1000系上引入了对单通道纹理(例如R16F)的2:1压缩技术,不仅能支持亮度映射图(luminance map)、阴影映射图(shadow map)以及HDR纹理,ATI对此压缩技术也并到了3Dc中,并称之为3Dc+。Hierarchical Z采用了更加精确的可见面检查算法,能比以往的RADEON GPU多剔除掉50%的隐藏面像素操作。
X1800纹理拾取功能的缺失使HDR和DM效能上存在很大疑问,需要进一步的解释。应该说这方面NA存在一些差异。R520架构设计比G70要早不少时间,设计思路是注重文理细节的性能表现,之后的G70开始转向HDR性能和RM特效,所以这方面G70应该优势比较明显。

公版的Radeon X1800XT

展示过7800GTX的“怪物”,自然也要展示一下X1800XT TOP |