回首页
小熊论坛 | 用户名: 密码: 没有注册?
我现在的位置:小熊在线首页 -> 显卡频道 -> 正文

让世界匍匐在我脚下-8800GT皇霸测试

BEAREYES.COM 北京 [ 原创 ] 作者:小熊在线——WolStame 日期:2007年10月29日


第9页:重新定义真实,全新的设计思想-革命性的G8x登场

从NV3X的失败,到NV4X的大改,到G7X的平衡,我们看到的是一个“经典失败”架构的起死回生。而从X800,X1800那眼花缭乱的衍生型号,到X1600 X1650 X1900 X1950的自乱阵脚,ATI给人的感觉就是每次都慢了半拍,每次试图夺回主动权的举动,都会陷入对手更深层次的陷阱中。NV成熟的市场运做能力不得不让人惊叹。小熊在线www.beareyes.com.cn

在仔细分析了未来图形渲染发展的趋势后,NV50,也就是现在的G8X体系,于2002年上半年被定项,它将是NV面向未来的架构,集中了众多的新玩意,支持DX10,风险较大,有一个比较长的研发周期。为了对抗R3XX及其后续产品,同时被提上日程的,还有NV30的洗心革面版----NV4X。小熊在线www.beareyes.com.cn

不过,R5XX至少已经在性能上击败了延续自NV40的G7X,终于轮到NV30正统后续者----NV50(G80)出场的时候了。我们今天要为大家介绍的G84/86都属于这个体系里的一员。

纵观GPU的发展历史,从GeForce 256(NV10)的120MHz,简单的1×4pipeline固定功能(Fix-funciton)流水线,到最近Radeon X1950XTX(R580)的650MHz,3×16pipeline,高度可程序化的Shader流水线,提高性能的途径无非是两种:通过不断提高GPU工作的时钟频率(Frequency)或者通过为GPU不断增加平行渲染管线(pipeline)来提高单位时间内的数据吞吐量。小熊在线www.beareyes.com.cn

不过,这样做并非最佳方法。首先,随着时钟频率的提高,GPU受到外部存储器(显存)的影响越来越大。一个工作频率在600MHz的GPU,内部每个时钟周期的长度在1.6ns左右,而我们可怜的显存还在以200-300MHz(2.0GHz GDDR4)的速度工作(GDDR4使用8位预取结构[Octal Data Rate]设计,数据频率是核心频率的8倍)。更加糟糕的是,GPU对显存的存取动作的指令也会有延迟周期(CAS,RAS),这样,从GPU开始存取放在芯片外面的DRAM,到第一个data送出的时间差最小也有几十个ns,以GPU内部的时钟频率而言可能会有几十到上百个周期的损失。传统意义上的流水线在这种情况下会陷于无限的等待之中,这会对GPU的正常工作造成严重的影响。小熊在线www.beareyes.com.cn

其次,单纯的增加平行管线(pipeline)的数量,也会带来一系列问题。工艺制成就已经决定了一个时间段内GPU的集成度,流水线数量不可能无限制增加。而进入Shader时代后,事情开始进一步变得麻烦了。随着游戏引擎的复杂化,流水线再也没有固定的处理流程。例如,现在游戏中常见的HDR光照首先需要将一个预先写好的整个场景的光照信息保存在FP格式的texture里,然后利用ALU进行算术运算渲染到另一个目标纹理并求出平均亮度,输出的像素必须在TMU单元中经过一次混合过滤,最后根据已有的事先写好的效果再对像素进行Texture混合,整个过程要通过Pixel Shader不断的算术运算来为纹理加上想要的效果,不再是单方向的深度流水线;Displacement mapping需要颠覆正常的VS->PS的渲染流程,让VS利用顶点纹理拾取(Vertex Texture Fetch,实质上就是给VS配备mini TMU)或者渲染到顶点缓存(R2VB)的方式从PS读取纹理信息直接映射到顶点上,这又改变了流水线的行进方向;一些复杂的光照生成用到的Deferred shading(延迟渲染)技术,要先输出G-Buffer到MRT,然后回过头来根据MRT再进行渲染........

Batch Size与效率之间的关系,这张图用对阴影边缘进行柔和取样来当作说明

总之,Shader时代的GPU流水线已经越来越没有固定的渲染流程。而且Shader本身也开始变得不确定性。在ShaderModel 1.0时代,因为硬件和API的限制,开发人员只能写很“笨”的Shader。但到了ShaderModel 2.0,3.0以及最近DX10引入的4.0版本,Shader最大指令数的提高,临时暂存器数量的增加,纹理格式的丰富,以及一系列的流控制指令[像是循环(loops)、分支(branching)、呼叫(call)和返回(return)及子程序(subroutine)等]的引入,赋予了Shader真正的编程能力,Shader的结构已经变得越来越非线性。传统意义上的流水线在这种复杂shader下效率是很低的,必须引入Multi-Threading对这些复杂的渲染过程进行控制和管理,才能合理利用到流水线的资源,单纯的增加GPU的平行管线数量已经难以获得有效的性能提升。

近些年来,体系结构设计者已经注意到了单纯提高时钟频率和增加平行管线的难度和不经济性,以及由此带来的功耗方面的负面影响。于是,一种新的性能公式在NV50(G8X)上被提出:Performance(性能) = Frequency(时钟频率) × IPC(Instruction per cycle,每周期指令数,既指令吞吐效率) × Multi-threading(多执行诸架构) 。换句话说,G8X已经抛弃了传统的增加平行管线(Popeline)来获得性能提升的思想。小熊在线www.beareyes.com.cn

G80 GPU的渲染体系

《GeForce 8的多执行诸体系(1)》...继续下一页>>

《王者归来》...返回上一页<<


[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [上一页] [下一页]

《让世界匍匐在我脚下-8800GT皇霸测试》分页索引


第1页:DX10 困局
第2页:DX10 API
第3页:DX10先进特性介绍
第4页:DX10 先进特性介绍 续
第5页:历代NVIDIA经典显卡回顾
第6页:从TNT到GeForce
第7页:步入shader纪元
第8页:王者归来
第9页:重新定义真实,全新的设计思想-革命性的G8x登场
第10页:GeForce 8的多执行诸体系(1)
第11页:GeForce 8的多执行诸体系(2)
第12页:GeForce 8的标量化渲染单元(1)
第13页:GeForce 8的标量化渲染单元(2)
第14页:GeForce 8的模块化频率异步架构
第15页:GeForce 8对DirextX 10的支持
第16页:GeForce 8在通用计算方面的潜力
第17页:8800GT-一个并非全新,但却依然拥有革命性的产品
第18页:参测显卡介绍-XFX-Geforce 8800GT(上)
第19页:参测显卡介绍-七彩虹 Geforce 8800GT(下)
第20页:参测显卡介绍-七彩虹 Geforce 8800GT(上)
第21页:参测显卡介绍-七彩虹 Geforce 8800GT(下)
第22页:8800GT重要提升之处-65nm PCIE2.0 改进ROP以及TRAA(上)
第23页:8800GT重要提升之处-65nm PCIE2.0 改进ROP以及TRAA(下)
第24页:8800GT也高清-整合全新一代的PureVideo HD
第25页:关于各类编码的详细分析(上)
第26页:我们用户关心的事情是?
第27页:什么编码最令人头痛
第28页:什么样的CPU能够满足H264/VC-1/MPEG2片源软解的要求
第29页:AMD/INTEL多达11款CPU的纯软解压测试-H.264
第30页:AMD/INTEL多达11款CPU的纯软解压测试-VC-1
第31页:AMD/INTEL多达11款CPU的纯软解压测试-MPEG2
第32页:G92 PureVideo HD开启与否测试
第33页:测试平台介绍
第34页: 超频以及3Dmark05测试
第35页: 失落的星球:极限状态(Lost Planet)DX10实际测试
第36页: 英雄连(Company of Heroes)DX10实际测试
第37页: 世界冲突(World in Conflict)DX10实际测试
第38页: 生化震撼(Bioshock)DX10实际测试
第39页: 鱼雷快艇:海上骑士(PT Boats: Knights of theSea)DX10实际测试
第40页: 孤岛危机(Crysis)DX10实际测试
第41页: 潜行者:切尔诺贝利的阴影{S.T.A.L.K.E.R}实际测试
第42页: 虚幻竞技场3(UT3)实际测试
第43页: 彩虹6号:维加斯(Tom Clancy’s Rainbow Six)实际测试
第44页: 使命的召唤4(Call of Duty4)实际测试
第45页: 时空飞梭(Timeshift}实际测试
第46页: 雷神战争(Quake Wars)实际测试
第47页:总结

全文

BEAREYES.COM 北京 日期:2007年10月29日

网友评论:(请各位网友遵纪守法并注意语言文明,留言仅供参考不代表本站立场) TOP↑
用户名: 密码: 没有注册?
点击排行
留言排行
小熊在线公司版权所有 beareyes.com ©1999-2007 All Rights Reserved
本网站由 北京快网 提供FastDNS智能解析服务