最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

游戏迷必看 笔记本显卡管线之迷

笔记本显卡 crifan 2392浏览 0评论

游戏迷必看 笔记本显卡管线之迷
                                        –解读“管线”、“像素处理单元”、“流处理器”
作者:SHINICHIKODO     2007-06-22

【IT168 选购技巧】前些日子,笔者受朋友之托,与其一同挑选玩游戏用的笔记本,不过在一家店面,笔者却听到了这样一段话:“这台笔记本装有最新的8400GS显卡,拥有16条管线,性能超群。”听到此话,笔者着实狂汗了一把,GeForce8400GS的标注的是16个流处理器,并非我们常见的标注——“管线”;同样的也有标注“像素处理单元”的,例如AMD(ATI)Radeon X1000系。那么究竟什么是管线呢?看来有必要解释一下“管线”的由来。
  “管线”的全称应该是“图形渲染管线”。它好像是工厂的流水线一样,按照不同的生产指令来产生3D图形。通俗一点来讲,一条完整的渲染管线应该是可以独立完成图形渲染任务的所有处理单元的总合。所以管线的定义需要配合相应的API(应用软件接口程序)来进行,不同的API程序对管线的要求也是不尽相同的。以我们最常见的DirectX程序为例,一条管线包括顶点渲染引擎、像素渲染引擎、光栅化引擎三个部分。

  传统渲染管线构架

  Vertex Shader(顶点渲染引擎):通常简称VS,它的主要任务是生成3D图形的骨架——顶点。任何3D图形在计算机中,其实只是由两种形式的存在,即构成骨架的顶点,以及联结个顶点的直线。比如说我们生活中最常见的圆,但是计算机并不认为它是圆,而是正多边形,当然如果对精度要求很高的话,这个正多边形可以是正千边形,而这个正千边形的顶点就是由VS构建成型的,这就是VS的作用。

VS单元结构
经过PS处理后的图型

  Pixel Shader(像素渲染引擎):通常被称作PS,它的作用是继续VS后面的工作——在构建了图形的顶点之后,还需要处理图形表面的纹理、像素值、颜色等等的信息,使他们达到预期的效果。在PS引擎中,还可以详细分为“像素渲染单元”(Pixel Shader Unit简称PSU)及“纹理贴图单元”(Texture Shader Unit简称TMU)。前者负责像素的运算工作,比如游戏中的光影效果、HDR等都是通过PSU来实现的;后者主要负责纹理贴图的处理工作,比如岩石、水面的反光等等。

  Rop(光栅化引擎):此部分主要负者像素的最终输出工作,执行像素的读写操作、Z-Buffer检测,色彩混合、抗锯齿等操作。得益于上面3部分的密切配合,我们才能在计算机上看到栩栩如生的3D场景。当然,这3部分是我们将GPU抽象化之后,得出的最基本的元件,其实,GPU中还有很多其他的控制单元,这里就不一一介绍了。

http://publish.it168.com/2007/0622/20070622022801.shtml

DirectX 8时代,VS、PS、POP单元是1:1:1的关系,即完整的管线在一次处理过程中,必须要经过VS、PS、ROP单元的处理。但是,目前主流的DirectX 9中,这一比例被打破,但最基本的图形处理过程仍旧没有本质的变化。 知道了一条最基本的图形渲染管线的组成之后,我们大概了解到一个GPU最少应该具有一条完整的渲染管线,但是我们都知道,现在DirectX 9的环境下,一条管线很难完成图形渲染的需要,于是多条管线并行处理的结构诞生了。多管线结构带来的优点就是:工作效率显著提高,所以高端显卡的管线数量要明显多于入门级显卡,比如GeForce7900GT拥有24条管线,而GeForce 7300GT只有8条管线。

  在管线数量相同的情况下,管线结构设计的进化也会影响GPU的性能,比如同是12管线的GeForce 7600GT与GeForce 6800GS相比,GeForce 7600GT性能较高。当然,影响显卡性能的参数还有很多,比如显示核心的频率、显存位宽、显存频率、显存容量等。简单来说,GeForce7300GT(8管线)部分高频版的显卡的性能使者能好于GeForce7600GS(12管线)。

AMD (ATi)采用3:1构架的R580核心

  增加管线的数量得以提升显卡的性能,故市场上很多显卡都是以管线的数量来标定产品的性能,不过目前更多的显卡都标以“XX像素处理单元”。像素处理单元和传统的管线又有什么关系呢?DirectX 9时代以来,PS、VS、ROP的比例已经打破1:1:1的比例,原因就是,由于3D技术的发展,管线的各部分负载压力逐渐变得十分不均衡。在图形处理工作中,VS能够很快地完成顶点的处理工作,但是PS却还在忙着处理贴图、纹理的数据,ROP部分也无法得到足够的信号来“开工”,结果PS单元成为了整个GPU的瓶颈。于是,管线中的PS数量开始得到增加,PS的数量也开始成为衡量显卡的重要标准之一。VS:PS由最初的1:1发展到目前的1:3,PS单元的重要性在不断加强。

传统管线结构 VS 统一渲染构架
统一构架原理
DirectX10.0构架示意图

  2005年底,GeForce7系发布后,ATI(AMD)也推出了Radeon X1000系列显卡,与以往不同的就是,Radeon X1000系列不在以“管线”的多少来恒定显卡的性能,取而代之的就是“像素处理单元”。据ATI的解释,游戏的处理过程经过了中纹理,到后来的纹理像素的平衡、再到现在的重像素三个阶段,而且按照游戏渲染方面的需要,未来的游戏会更加偏重于对像素的处理,而对纹理贴图的要求并没有提高很多,所以ATI就定不再单纯的增加管线的数量,而是单独增加PS中的PSU的数量,其实这还是在增强PS的作用,不过不同的是,PSU与TMU的比例发生了变化。

  其实这一点nVIDIA其实也在实行,比如GeForce7900GTX中PSU得数量实际上是48个,采用两个一组的串行方案,但是nVIDIA仍以传统的24PS来标记24管线;而ATI的Radeon X1950XTX则标记为48像素处理单元(PSU),如果换算成传统的方式,X1950XTX则为8VS+16PS+16ROP,即16管线。48PSU实际被包含在16PS中(PSU:TMU=3:1),这就使ATI著名的3:1构架。由于PSU的大幅增加,使得ATI的显卡在一些偏重遇像素处理的游戏中大放光彩,特别是在复杂光影场景、HDR场景以及开启全屏抗锯齿之后,多PSU的优势一览无余。

  从整体的性能上,我们可以大致认为ATI 3:1构架的显卡是普通1:1构架的1.5倍左右。也就是说如果某块拥有48像素处理单元的ATI的显卡,他的性能大致是与nVIDIA的24管线的显卡性能相当。(N卡管线=A卡管线 / 3*1.5)

http://publish.it168.com/2007/0622/20070622022802.shtml

  几个月前,DirectX 10的游戏《狂野西部》发布试玩版,为了适应DirectX10的发展,新一代的显卡发布,在这一代显卡的GPU中,VS单元与PS单元逐渐融合,并且出现了一个新的概念“流处理器”,他既可以处理VS的工作,也可以处理PS的工作,但他也不能够被称为“管线”。

  比如GeForce8800GTX有128个流处理器,但是并不是128管线。开头提到的GeForce8400GS实际上就是拥有16个“流处理器”,并不是销售人员口中所说的“管线”。但是,FANS们对于ATI (AMD)3:1构架与nVIDIA传统构架的争论,在统一构架已经实现的今天仍在继续,可以说公说公有理,婆说婆有理,究竟谁对呢?可以说这两家的FANS都没有错,的确这两种构架可以说各有优势,ATI得益于3:1构架,能够流畅的运算大量的像素及复杂的光影效果,因此在此类游戏中大放光彩,比如《极品飞车:卡本峡谷》,《命令与征服3》。而在另一方面,当游戏不需要复杂的光影,却需要复杂的场景贴图时,nVIDIA的传统构架有占上风,因为此类游戏需要大量VS及TMU的运算。代表游戏有《最高指挥官》、《模拟飞行X》、《帝国时代3》等。

光影效果的对比(一次为GF8800、X1950XTX、GF8800、X1950XTX)

  现在越来越多的人选择用本本来玩游戏,这对于本本的显卡要求很高。大家都知道,笔记本电脑是整体销售的,其内部的部件尤其是显卡的参数并不像DIY市场一样透明,了解了何为管线之后,我们就不会再商家的宣传中迷失方向,尤其是不会蒙蔽于本本商家的信口开河,从而买到自己心仪的产品。

http://publish.it168.com/2007/0622/20070622022803.shtml

转载请注明:在路上 » 游戏迷必看 笔记本显卡管线之迷

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

网友最新评论 (4)

  1. 很好很强大
    过路人15年前 (2010-03-07)回复
  2. 这些文章对大多数的人来说太有用了!!非常好!!很感谢很感谢!!!!买之前要多来看看就更好了
    情至深17年前 (2008-03-19)回复
  3. 写的很受用 谢谢
    DoB_17年前 (2008-01-15)回复
  4. 写的好!
    --18年前 (2007-08-23)回复
83 queries in 0.197 seconds, using 22.31MB memory