1、显卡基础知识分享1大纲 常用工具介绍 NVIDIA NVAPI介绍2概念 显卡(Video card,Graphics card)全称显示接口卡,又称显示适配器(Video adapter),是计算机最基本最重要的配件之一。显卡接收由主机发出的控制显示系统工作的指令和显示内容,然后通过输出信号控制显示器显示各种字符和图形。它将电脑的数字信号转换成模拟信号让显示器显示出来。3分类 集成显卡:集成在主板或CPU上(集成在CPU上的显卡又称核心显卡)优点:功耗小,发热低,需要系统内存。缺点:性能略低,无法更换。独立显卡:工艺技术可比CPU还先进。优点:独立插槽,自带显存,性能较高。缺点:功耗,发热大
2、,额外的资金。4结构 显示芯片(GPU),在显卡上最大的芯片就是显示芯片。一般的显卡都采用单芯片设计的显示芯片,高档专业的显卡则通常采用多个显示芯片组合的方式。显示芯片就像专门用来处理图像的CPU,它可以完成某些特定的绘图功能,采用何种主显示芯片决定了一款显卡性能的高低。目前常见的显卡芯片上都有散热芯片或散热风扇,可使显卡稳定工作。显示内存,显存与系统内存的功能是类似的,显存用来暂存显示芯片处理的数据,系统内存则用来存储CPU处理的数据。其容量与存取速度将直接影响显示的分辨率及其色彩位数。显存分辨率*色深位数/8。显卡BIOS,存放显示芯片与驱动程序之间的控制程序,另外还储存有显示卡的型号、规
3、格、生产厂家及出厂时间等信息。接口,显卡总线接口,用于连接显卡与主板,使显卡和主板进行数据交换。视频输出接口,常见的有HDMI,Display Port,VGA,DVI等。部分新款显卡增加了Type-c接口。5原理 CPU将数据通过总线传送到显示芯片 显卡上的显示芯片对数据进行处理,并将处理结果存放结果在显存中 显卡从内存中将数据传送到RAMDAC并进行数/模转换 RAMDAC将模拟信号通过显示接口送到显示器6性能 GPU核心频率,显卡的核心频率是指显示核心的工作频率,其工作频率在一定程度上可以反映出显示核心的性能,但显卡的性能是由核心频率、显存、像素管线、像素填充率等等多方面的情况所决定的,
4、因此在显示核心不同的情况下,核心频率高并不代表此显卡性能强劲。流处理器数量,即着色单元,PixelShader(NVidia推出了CUDA并行计算架构,让显卡可以用于图形渲染以外的目的。所以把N卡的流处理器称作CUDA core。AMD也有类似的技术,叫AMD stream,相应的,AMD的流处理器也叫Stream Processor)。流处理器是一款显卡最核心的卖点,同架构显卡中,流处理器数量越多,性能也越强大,但流处理器数量的提升和性能的提升并不成正比,这也涉及到架构的流处理器效率问题 架构及制造工艺,更新的架构和制造工艺能够较大幅度的提示显卡性能。7性能 显存类型,显卡上采用的显存类型主
5、要有SDR、DDR SDRAM、DDR SGRAM、DDR2、GDDR2、DDR3、GDDR3、GDDR4、GDDR5。目前的主流是GDDR3和GDDR5。显存速度,频率,显存速度一般以ns(纳秒)为单位。常见的显存速度有1.2ns、1.0ns、0.8ns等,越小表示速度越快、越好。显存的理论工作频率计算公式是:等效工作频率(MHz)=1000n/(显存速度)(n因显存类型不同而不同,如果是GDDR3显存则n=2;GDDR5显存则n=4)。显存位宽,显存位宽是显存在一个时钟周期内所能传送数据的位数,位数越大则相同频率下所能传输的数据量越大。市场上的显卡显存位宽主要有128位、256位等。显存带
6、宽,显存带宽=显存频率x显存位宽/8,它代表显存的数据传输速度。在显存频率相当的情况下,显存位宽将决定显存带宽的大小。8性能 像素填充率,是指图形处理单元在每秒内所渲染的像素数量,单位是 MPixel/S(每秒百万像素),或者GPixel/S(每秒十亿像素),是用来度量当前显卡的像素处理性能的最常用指标。显卡的渲染管线是显示核心的重要组成部分,是显示核心中负责给图形配上颜色的一组专门通道。渲染管线越多,每组管线工作的频率(一般就是显卡的核心频率)越高,那么所绘出的显卡的填充率就越高,显卡的性能就越高,因此可以从显卡的象素填充率上大致判断出显卡的性能。简单的说,一款显卡的性能由“像素填充率”和“
7、显存带宽”两个部分构成。“像素填充率”衡量的是显卡的图形运算能力,“显存带宽”衡量的是显卡的数据传输能力。像素填充率的公式是:像素填充率=渲染管线数量核心频率。像素填充率由显示核心的规格决定,也就是显示核心的运算能力,但要把GPU的运算能力全部发挥出来,还需要良好的传输通道,也就是搭配合理、不至于形成瓶颈的显存规格来决定,最重要的衡量指标就是显存带宽。9性能 散热设备:由于运作集成电路(integrated circuits)需要相当多的电力,因此内部电流所产生的温度也相对较高,假如这些温度不能适时的被降低,那么上述所提到的硬设备就很可能遭受损害,GPU或内存会过热,就会进而损害计算机或造成当
8、机,或甚至完全不能使用。散热片的表面积愈大,所进行之散热效能就愈大,但有时却因空间的限制,大型散热片无法安装于需要散热的装置上,因此,热管就必须在这个时候将热能从散热处传送至散热片中进行散热。一般而言,GPU外壳由高热能的传导金属所制成,热管会直接连结至由金属制成的芯片上,如此一来,热能就能被轻松的传导至另一端的散热片。GPU温度过高时,控制程序会降低GPU的工作频率以保护GPU,这样会导致GPU不能发挥出最高性能10双显卡技术 多显卡技术的出现,是为了有效解决日益增长的图形处理需求和现有显示芯片图形处理能力不足的矛盾。AMD-ATI的多显技术叫做CrossFire;NVIDIA的多显技术叫S
9、LI,简单的说就是:让两块或者多块显卡协同工作,是指芯片组支持能提高系统图形处理能力或者满足某些特殊需求的多显卡并行技术。要实现多显卡技术一般来说需要主板芯片组、显示芯片以及驱动程序三者的支持。11双显卡技术 NVIDIA的SLI技术,有两种渲染模式:分割帧渲染模式(Scissor Frame Rendering,SFR)和交替帧渲染模式(Alternate Frame Rendering,AFR),分割帧渲染模式是将每帧画面划分为上下两个部分,主显卡完成上部分画面渲染,副显卡则完成下半部分的画面渲染,然后副显卡将渲染完毕的画面传输给主显卡,主显卡再将它与自己渲染的上半部分画面合成为一幅完整的
10、画面;而交替帧渲染模式则是一块显卡负责渲染奇数帧画面,而另外一块显卡则负责渲染偶数帧画面,二者交替渲染,在这种模式下,两块显卡实际上都是渲染的完整的画面,此时并不需要连接显示器的主显卡做画面合成工作。在SLI状态下,特别是在分割帧渲染模式下,两块显卡并不是对等的,在运行工作中,一块显卡做为主卡(Master),另一块做为副卡(Slave),其中主卡负责任务指派、渲染、后期合成、输出等运算和控制工作,而副卡只是接收来自主卡的任务进行相关处理,然后将结果传回主卡进行合成然后输出到显示器。由于主显卡除了要完成自己的渲染任务之外,还要额外担负副显卡所传回信号的合成工作,所以其工作量要比副显卡大得多。另
11、外,在SLI模式下,就只能连接一台显示器,并不能支持多头显示。12双显卡技术 在渲染模式方面,CrossFire 除了具有 SLI 的分割帧渲染模式和交替帧渲染模式之外,还支持方块分离渲染模式(SuperTiling)和超级全屏抗锯齿渲染模式(Super AA)。方块分离渲染模式下是把画面分割成 32X32 像素方块,类似于国际象棋棋盘方格,其中一半由主显卡负责运算渲染,另一半由副显卡负责处理,然后根据实际的显示结果,让双显卡同时逐格渲染处理,这样系统可以更有效的配平两块显卡的工作任务。在超级全屏抗锯齿渲染模式下,两块显卡在工作时独立使用不同的 FSAA(全屏抗锯齿)采样来对画面进行处理,然后
12、由图象合成器将两块显卡所处理的数据合成以输出高画质的图像;在这种模式下,对整个画面的渲染工作不是一分为二来分配给两块显卡,而是每一块显卡都要完整渲染一次,即每块显卡在这里的工作量都和单显卡渲染模式时是一样的,只不过最后图象合成器会把两块显卡分别渲染的画面合成起来作为最终的显示画面;在这种模式下,由于画面的每个像素点都被渲染二次,因此可以大大提升图像显示画质,例如一块显卡采用 8 倍 FSAA 而另外一块显卡采用 6 倍 FSAA。则最终显示的画面就可以达到 14 倍 FSAA;所以超级全屏抗锯齿渲染模式是提高渲染画质而并不能提升渲染速度。与 SLI 不同的是,CrossFire 还支持多头显示
13、,如果配合整合了显示芯片的 ATI 芯片组主板,最多可以支持 5 个显示屏输出。不过在多头显示模式下 CrossFire 就没太大空间提升性能和画质了(多屏的分辨率非常高)13大纲 NVIDIA NVAPI介绍14GPU-Z 检测显卡GPU型号、制造工艺、核心面积、晶体管数量,渲染器数量及生产厂商。检测光栅和着色器处理单元数量及DirectX支持版本。检测GPU核心、着色器和显存运行频率,显存类型(生产厂商)、大小及带宽。检测像素填充率和材质填充率速度。实时检测GPU温度、GPU使用率、显存使用率及风扇转速等相关信息。检查显卡插槽类型和显卡所支持的附加功能与显卡驱动信息及系统版本。15GPU-
14、Z GPU-Z中像素填充率、纹理填充率、显存带宽的计算公式:像素填充率(Pixel Fillrate)=核心频率(GPU Clock)光栅单元数目/1000 纹理填充率(Texture Fillrate)=核心频率(GPU Clock)纹理单元数目/1000 显存带宽(Band width)=显存位宽(Bus Width)显存等效频率/816DXVA Chcker 确认解码器和处理器设备可与GPU的使用。确认在其他应用程序的使用情况的跟踪日志。确认支持的模式和DirectShow中/媒体基金会的解码器的使用条件。环境中的一些DirectShow/媒体基金会解码器的变化。确认通过改变参数,改变视频处理器解码/处理器设备当播放视频时产生的效果。17NVIDIA Inspector 显卡信息查看,超频,显卡配置18NVIDIA Inspector19大纲20NVAPI 修改NVIDIA显卡全局设置 修改单个应用的显卡相关配置项21