回首页
小熊论坛 | 用户名: 密码: 没有注册?
我现在的位置:小熊在线首页 -> 显卡频道 -> 正文

让世界匍匐在我脚下-8800GT皇霸测试

BEAREYES.COM 北京 [ 原创 ] 作者:小熊在线——WolStame 日期:2007年10月29日


第11页:GeForce 8的多执行诸体系(2)


G8X的TPC结构图

每个Multiprecessor所管理的结构


G80的线程管理调度器被命名为GigaThread,从前缀“Giga”我们就可以感受到它强大的调度能力和充沛的资源。G80将128个Unified Streaming Precessor(通用流处理器)分成8组,每组称为一个“TPC”,每个TPC有2个线程和分支管理调度器(Multiprocessor),每个Multiprocessor都具备有16KB的On-Chip Shared memory,总共16个Multiprocessor被一个宽度超过2000bit的Crossbar网络连接起来。G80的Multiprocessor把每份data都用一个Thread管理,每个pixel,每个vertex都算成一个Thread。通过On-Chip Shared memory(片上共享缓存),G80能以32个pixel或vertex(2TCP 32SP)为一个warp(Thread切换的基本单位,可以理解为像素阵列)来切换Thread。每个TCP内都可以混进任意不同的VS、PS指令。为了保证流水线足够的平行性,G80在同一个时间段内流水线一共可以维持总共8192个Thread。G80的所有On-Chip Shared memory、Global memory、Constant Memory、Texture Memory都是独立的,所以G80的片内cache一共是16KB×16 + 8KB×8 + 8KB×8 = 384KB,加上128KB独立的L2 Cache,G80的片内缓存一共是512KB!相比之下,R580的流水线一共可以维持最多512个Thread,而且并不是Per pixel的,每个Thread都要负责管理一个4×4的像素块;R580的片上缓存不会超过100KB。小熊在线www.beareyes.com.cn

G80的分层Thread体系中的On-Cinp Memory

所有的这一切都为G80的流水线提供了几乎无穷无尽的动力。不管存储器延迟带来多少个stall,不管Shader如何复杂多变,G80的GigaThread线程管理调度器都可以掩盖延迟,调整Thread顺序,优化Shader流程,让每一个平行管线都时刻能保持充沛的处理状态。举个例子,比如:
code:
add r1, r2, r3
add r3, r1, r2
这种相关性的指令,第二条指令需要使用第一条指令的结果, 由于流水线的关系, add指令可能需要n个周期才retire, 所以第二个add需要等待流水线完成才能进行处理。遇到这样的情况,G80就直接切换到其他的thread,最大限度的保证处理单元的利用率。小熊在线www.beareyes.com.cn

G8X的分支性能减少了指令间的依存性

由于Multi-thread会成为影响Shader效率的重要关键,而被视为未来GPU效率的重大影响因素。GPU的性能越来越不再是只单纯地受到流水线数量、Shader数量或是时钟频率等的因素影响,而越来越难以判断了。比方说,即使(理论效能XXX GFLOPS)有高有低,但因为Multi-thread之类的Shader控制结构的不同会影响效率,实际上的性能高下可能又是另外一回事了。G8X架构体系将Multi-threading架构推向了新的高峰。小熊在线www.beareyes.com.cn

《GeForce 8的标量化渲染单元(1)》...继续下一页>>

《GeForce 8的多执行诸体系(1)》...返回上一页<<


[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [上一页] [下一页]

《让世界匍匐在我脚下-8800GT皇霸测试》分页索引


第1页:DX10 困局
第2页:DX10 API
第3页:DX10先进特性介绍
第4页:DX10 先进特性介绍 续
第5页:历代NVIDIA经典显卡回顾
第6页:从TNT到GeForce
第7页:步入shader纪元
第8页:王者归来
第9页:重新定义真实,全新的设计思想-革命性的G8x登场
第10页:GeForce 8的多执行诸体系(1)
第11页:GeForce 8的多执行诸体系(2)
第12页:GeForce 8的标量化渲染单元(1)
第13页:GeForce 8的标量化渲染单元(2)
第14页:GeForce 8的模块化频率异步架构
第15页:GeForce 8对DirextX 10的支持
第16页:GeForce 8在通用计算方面的潜力
第17页:8800GT-一个并非全新,但却依然拥有革命性的产品
第18页:参测显卡介绍-XFX-Geforce 8800GT(上)
第19页:参测显卡介绍-七彩虹 Geforce 8800GT(下)
第20页:参测显卡介绍-七彩虹 Geforce 8800GT(上)
第21页:参测显卡介绍-七彩虹 Geforce 8800GT(下)
第22页:8800GT重要提升之处-65nm PCIE2.0 改进ROP以及TRAA(上)
第23页:8800GT重要提升之处-65nm PCIE2.0 改进ROP以及TRAA(下)
第24页:8800GT也高清-整合全新一代的PureVideo HD
第25页:关于各类编码的详细分析(上)
第26页:我们用户关心的事情是?
第27页:什么编码最令人头痛
第28页:什么样的CPU能够满足H264/VC-1/MPEG2片源软解的要求
第29页:AMD/INTEL多达11款CPU的纯软解压测试-H.264
第30页:AMD/INTEL多达11款CPU的纯软解压测试-VC-1
第31页:AMD/INTEL多达11款CPU的纯软解压测试-MPEG2
第32页:G92 PureVideo HD开启与否测试
第33页:测试平台介绍
第34页: 超频以及3Dmark05测试
第35页: 失落的星球:极限状态(Lost Planet)DX10实际测试
第36页: 英雄连(Company of Heroes)DX10实际测试
第37页: 世界冲突(World in Conflict)DX10实际测试
第38页: 生化震撼(Bioshock)DX10实际测试
第39页: 鱼雷快艇:海上骑士(PT Boats: Knights of theSea)DX10实际测试
第40页: 孤岛危机(Crysis)DX10实际测试
第41页: 潜行者:切尔诺贝利的阴影{S.T.A.L.K.E.R}实际测试
第42页: 虚幻竞技场3(UT3)实际测试
第43页: 彩虹6号:维加斯(Tom Clancy’s Rainbow Six)实际测试
第44页: 使命的召唤4(Call of Duty4)实际测试
第45页: 时空飞梭(Timeshift}实际测试
第46页: 雷神战争(Quake Wars)实际测试
第47页:总结

全文

BEAREYES.COM 北京 日期:2007年10月29日

网友评论:(请各位网友遵纪守法并注意语言文明,留言仅供参考不代表本站立场) TOP↑
用户名: 密码: 没有注册?
点击排行
留言排行
小熊在线公司版权所有 beareyes.com ©1999-2007 All Rights Reserved
本网站由 北京快网 提供FastDNS智能解析服务