造价通

反馈
取消

热门搜词

造价通

取消 发送 反馈意见

曲面细分细分技术

2022/07/16153 作者:佚名
导读:曲面细分NVIDIA细分 作为GPU领域的领军者,nVIDIA认为曲面细分技术所代表的GPU几何性能是新一代显卡最重要的功能,也是DirectX 11最重要的组成部分。GPU的发展从Geforce FX5800时代发展到Geforce GTX285,五代时间内像素处理能力增长了1500%,而几何性能只增长了300%。因此nVIDIA认为几何性能已经成为制约GPU性能的瓶颈,在新一代Fermi架构(

曲面细分NVIDIA细分

作为GPU领域的领军者,nVIDIA认为曲面细分技术所代表的GPU几何性能是新一代显卡最重要的功能,也是DirectX 11最重要的组成部分。GPU的发展从Geforce FX5800时代发展到Geforce GTX285,五代时间内像素处理能力增长了1500%,而几何性能只增长了300%。因此nVIDIA认为几何性能已经成为制约GPU性能的瓶颈,在新一代Fermi架构(费米架构,包括GT400,GT500系列显卡)中,要专门加强几何处理能力,曲面细分作为几何处理的典范便首先得到了加强。

在Fermi架构中,nVIDIA通过PolyMorph Engine,将Tessellation任务分配给CUDA单元(CUDA单元也就是通常说的“流处理器”,nVIDIA称其为CUDA单元)处理。Fermi第一代旗舰显卡GTX480拥有15个PolyMorph Engine,也就等效于拥有15个具有Tessellation技术处理能力的单元。

nVIDIA这样做的优点在于,可以在高曲面细分负载下获得优秀的曲面细分能力,也就是在纯Tessellation计算中GPU的几何性能相当出色。在单纯的Tessellation计算中,nVIDIA以16倍于AMD的Tessellation处理单元的数量,得到了6倍于AMD的Tessellation处理能力。不过缺点在于,这种设计占用了CUDA单元的计算能力,前文说过,曲面细分并不是DirectX 11的全部。在实际游戏中,并不是单纯的Tessellation计算。CUDA单元还要处理其他游戏相关的3D渲染数据,如果游戏中3D渲染数据处理需求不大,这种设计就不成问题,不过一旦3D渲染数据处理需求很大,比如高分辨率,高全屏抗锯齿,丰富的光影效果等,那么这种设计的缺陷就会暴露出来。

这就是在3DMARK 11中,GTX460成绩不如HD5830的原因之一,3DMARK软件图形、光照、抗锯齿计算压力很大,GPU还要分出CUDA单元去处理曲面细分计算,因此整体计算能力便捉襟见肘。再比如在《地铁2033》中,即使GTX580也不能打开全部效果在1080P下全程流畅运行, 且表现不及HD5970 。这与nVIDIA的曲面细分实现方法也是有关的。

曲面细分AMD细分

作为Tessellation技术的开发者,AMD(ATI) 对曲面细分的态度有所不同。AMD认为,在当前的DirectX 11游戏中,将一个物体的细分后最小的像素在16个是比较合适的,过分的加大曲面细分负载所带来的变化,是人的肉眼无法分辨的。因此AMD坚持对模型做适度的Tessellation处理才是理智的,过分的加大Tessellation计算负载,只是在白白浪费计算资源,因为人的肉眼无法分辨。

在Evergreen架构(即HD5000系列)中,AMD秉承了自R600以来的做法,集成了一个专用的Tessellation处理单元。在之后的Northern Islands架构的Barts核心中(即HD6800系列),AMD又对Tessellation处理单元做了优化,通过增强的线程分配模块设计,Barts核心在低Tessellation计算负载下拥有1.5倍于5800系列的处理能力。当然高负载下仍然不理想。之后的采用Cayman核心的HD6900系列显卡,则将专用的Tessellation处理单元增加到2个。

AMD这种设计的优点在于,专用的Tessellation单元并不占用流处理器资源,不影响3D渲染数据的计算。在实际游戏中,画面分辨率越高,抗锯齿级别越高,3D渲染处理需求越大,这种设计的优势就越明显。

其缺点是,在3D渲染数据处理需求不大时,遇到高负载Tessellation计算,便力不从心。

2011年12月22日,AMD发布了新一代测采用SI GCN架构的AMD Radeon HD7970显卡。得益于GCN架构,其曲面细分计算能力也得到了飞跃式的发展。HD7970显卡的曲面细分单元概念被几何引擎流水线所代替,仍为专用的2个,但是采用了最新的硬件Tessellation迭代单元,提高了顶点的复用度、片外缓存设计有所增强、采用了更大参数的高速缓存,因此HD7970的Tessellation和几何缓存都有显著的增强,能在所有拆分倍率下达到4 倍于HD6970 。与竞争对手相比,HD7970较之于GTX580,以八分之一的几何引擎数量获得了1.6倍的性能。特别是这种设计仍不会占用显卡的3D数据计算资源。

*文章为作者独立观点,不代表造价通立场,除来源是“造价通”外。
关注微信公众号造价通(zjtcn_Largedata),获取建设行业第一手资讯

热门推荐

相关阅读