首款“可编程”图形芯片——NV20 虽然GeForce 2无论在性能还是功能上都领先对手的同级产品相当长一段时间,但是2000年7月ATI推出了最新的高端武器——Radeon图形芯片。代号R100的首款镭卡拥有诸多超越NV15的新特性,比如关键帧补偿(keyframe interpolation), 四组矩阵蒙皮(four-matrix skinning), 环境凹凸贴图(environment bump mapping), ?3D纹理(3D-textures)和 HyperZ等等。 不过,ATI的这款产品来得太晚了,因为NV早已准备好进入下一个实时3D渲染时代的产品——NV20。命名为GeForce 3的NV20再一次为PC 3D界带来了革命。Geforce 3是第一款支持可编程的着色器(shader units)的图形处理器,NVIDIA称之为nfiniteFX引擎,它分成顶点(vertex)着色器和像素(pixel)着色器。Geforce 3比Geforce 256更加接近CPU,这得益于它的可编程特性。配合微软推出了DirectX 8,Geforce 3提供了像素着色器1.1和顶点着色器1.1的支持。当DirectX 8.1发布之后,Geforce3提供了像素着色器1.3的支持。由于其渲染管线具备了“可编程”的特性,因此不同与过去固定功能的显卡,游戏设计师在NV20上可以只有地实现自己想要创造的特效。当然,由于是第一款“可编程GPU”,NV20支持的着色器版本还比较低,因此功能上也有很多限制。小熊在线www.beareyes.com.cn 当年GF3跑3DMARK 01时的“惊艳画面” 此时ATI方面的脚步也越跟越紧,他们的R200在NV20发布半年后也渐渐浮出水面。不过此刻的NVIDIA在应付上仍然显得从容不迫。在R200尚未实际上市之前就发布了NV20的继任者NV25。命名为GeForce 4的NV25跟之前的NV15一样属于前代产品的改进加强版。在架构上仅仅比前者增加了一个VS(顶点着色器)。不过NV25就造就了NV历史上最具性价比的产品——GeForce TI4200!这款产品的性价比至今仍无“卡”能比。 NV2X家族还有一个独特的成员,那就是给微软的XBOX做显示芯片的NV2A。NV2A在功能上属于NV2X家族的最高版本,拥有一些NV20不具备的特性。 失足之作——NV30 正当NVIDIA还在为轻松欺压ATI的R200而沾沾自喜之际,ATI拿出代号为R300的Radeon 9700给了NV一记响亮的耳光。这一次,ATI成了带领实时3D渲图形染进入DX9时代的领头羊。 为了抢回领先的桂冠,NV不仅加速了NV30的开发进程,而且还冒死硬拼130NM制程。然而火上浇油的是,NV一直保持的每6个月一代的更新速度在这个节骨眼上却偏偏失灵了,而且当时台机电的130NM工艺出现了问题,结果导致NV30一再跳票。最后直到2002年11月,第一款NV30产品GeForce FX 5800Ultra才千呼万唤始出来。不过实际上市的时间还要再晚一些。然而更致命的是,这款万众期待的产品实际性能让整个业界大跌眼镜,人们发现NVIDIA原来连性能桂冠也给丢了。在那个shader性能开始占主导地位的年代,NV30仍然采用老套的4*2架构,把资源浪费在了象素填充率上。相比之下,R300 8*1的架构在象素着色器方面的资源比NV30多了一倍,再加上256位的显存带宽,使得其整体性能轻松超越NV30。特别是在shader数量多的新游戏里,NV30更是被杀得体无完肤。 不过由于受制于制造工艺的限制,GeForce FX 5800 Ultra的产量并不高。再加上性能不济,因此NVIDIA很快又推出了NV35顶替NV30。被命名为GeForce FX 5900的NV35在浮点着色器性能方面比GeForce FX 5800有了一倍的提升,引入了256位内存总线,解决了GeForce FX 5800发热和散热器噪音的问题。不过此时ATI也推出了R300的改进版R350,跟R350相比,NV35的象素着色器效能仍然存在许多问题。比如浮点像素着色器32位浮点临时寄存器用量每超过两个就会出现性能降低一半的现象;如果采用16位浮点精度可以暂缓这一限制,可以舒缓为每4个才会出现性能下降一半。就浮点像素着色器本身而言,32位浮点和16位浮点的着色器性能是一样的,性能的差别主要是由于临时寄存器不够造成的;还有着色器指令的顺序需要按照tex->tex->color->color的方式才能发挥出4X2流水线的最佳效率。R350方面则没有这些限制。因此NV35的性能仍然大幅落后于对手产品。
|