● 在混沌中寻找规律
既然是GPU炼金试验室的内容,做实验并以实验结果来推导出结论就成了必不可少的环节。那么我们的问题就来了——一个架构对显存的依赖程度,究竟要以怎样的实验形式来进行体现呢?
显卡是一个将运算和缓冲结构合并在一起的复杂体系,其运算结构尤为复杂。硬件渲染过程会被划分成多个不同的步骤并交由GPU内部的不同部件去完成,无论几何处理、光栅化、材质操作、Pixel Shader还是最终的输出,任何一步执行的快慢都会对显卡的最终性能产生影响,如果要细化的去探讨每一个细节,我们很有可能会迷失在一片由细节构成的混沌的迷宫当中。
想迷失在这样的流水线当中么?
所以,我们决定暂时略去过多的细节(当然,仅仅是“暂时”略去。随着实验的继续,我们还是会不可避免的触及某些细节。不过敬请放心,我们会控制好深度,而且这些细节也不会在本文中出现。),先将纷繁复杂的GPU逻辑架构看成一个不可划分的整体。以GPU作为整体来讨论的话,显卡就可以被划分成负责运算和操作的核心,以及负责为运算以及操作过程提供缓冲的显存两个部分了。而决定这两个部分性能表现的要素,也就可以被相对简单的转化成频率这一直接表征要素了。
对于一颗GPU核心而言,更高的频率意味着更大的运算能力,意味着同样的任务将可以被更快的执行完毕。而更高的显存频率则意味着显存体系可以提供更大的带宽,并且更好的为GPU的运算和操作过程提供缓冲。对于一块“搭配适宜”的架构,或者说非显存依赖性架构而言,GPU核心运算能力增长应该总能够带来最终性能的提升。显存带宽的提升对于这样的GPU架构而言应该是锦上添花而非雪中送炭,甚至在某些特定的频率范围内,显存带宽的提升将可能无法被转化成直接的性能提升。
GeForce GTX 780架构图
用更加通俗直白的语言来形容,就是“如果超核心所带来的性能提升大于超显存所带来的提升,同时超显存可能还会遇到没什么性能提升的时候,那这就是款非显存依赖的架构”。所以如果想要回答前页中的那些问题,我们要做的事其实就是观察不同核心及显存频率下显卡的性能。
基于这样的原则,我们决定设计如下实验过程:以测试显卡的默认核心频率(以下简称CC,Core Clock)及默认显存频率(以下简称MC,Memory Clock)为基准,以10%为频率调节幅度,对不同核心/显存频率的显卡性能进行测试。在将核心频率从90%调节至120%的同时,我们分别将显存频率在特定核心频率状态下从80%调节至120%,由此便产生了共计20组不同的核心及显存频率搭配方案,以及与之相对应的20组性能测试结果。
达成频率组合的工具:NVIDIA Inspector(Titan+320.39驱动视角)
以我们今天测试的GeForce GTX 780为例,测试产生的第一组数据为“90%CC+80%MC”,其含义为90%默认核心频率搭配80%默认显存频率。公版GeForce GTX 780的默认频率为863/6008MHz,此基准频率便是CC+MC搭配方案的频率,而90%CC+80%MC数据组的频率即为777 /5408MHz。相对应的,最后一组120%CC+120%MC的含义为核心及显存同时超频20%,即频率为1035/6608MHz。中间各组搭配方案,其频率皆依此规则来确定。
测试方案虽然复杂,但这样的测试过程可以带来不少好处——我们不仅可以在一个相对宽泛的频率区间(30%核心频率变化,40%显存频率变化)内观察不同核心及显存频率搭配之后的显卡性能情况,同时还能收获一个额外的副产品,那就是不同核心及显存频率提升幅度对显卡性能提升的贡献程度,这对于超频玩家来说应该算是一个不错的好消息。
好了,接下来就让我们从GK110架构的旗舰级显卡——GeForce GTX 780开始我们的实验之旅吧。
相关报道:
- 传三星打造自主品牌GPU 令其产业链锦上添花2014-09-17
- 视觉时代的回响 GPU十年历史追忆拾遗篇2013-09-18
- 视觉时代的回响 GPU十年历史追忆完结篇2013-08-23
- GPU霸气十足 APU平板演示视频曝光2013-04-10
- 骁龙600架构全解析 CPU/GPU详细测试2013-04-09
本类最新
本类最热
科技视界
要闻推荐
今日视点
热点专题
新闻图片
- 新闻排行
- 评测排行