推土机架构崭新技术

2018/06/19159 作者：佚名

导读：一、革新的Turbo Core技术——全核心加速技术 Turbo Core技术：主要是指对于一些没有完全消耗到最大程度的工作负载，去加快时钟速度。在多种不同工作负载上，使用了TurboCore可以最大增加500兆赫兹的性能。最重要的一点，TurboCore加速指的是所有核的加速，和有些核加速技术明显不同，以往的核加速技术可能需要关闭一些核，只对部分核进行加速。采用TurboCore技术，最多可以使

一、革新的Turbo Core技术——全核心加速技术

Turbo Core技术：主要是指对于一些没有完全消耗到最大程度的工作负载，去加快时钟速度。在多种不同工作负载上，使用了TurboCore可以最大增加500兆赫兹的性能。最重要的一点，TurboCore加速指的是所有核的加速，和有些核加速技术明显不同，以往的核加速技术可能需要关闭一些核，只对部分核进行加速。采用TurboCore技术，最多可以使所有核增速500兆赫兹，如果再关闭一些核运转的情况下，加速将会超过500兆赫兹。同时我们还对内存控制器进行了进一步优化，从而提高内存的吞吐量。

除了每个核心独享4个整数计算管线，在浮点运算上，“推土机”采用了“FlexFP”技术，两个核心共享一个浮点调度器和两个128位FMAC乘法累加器，可以进行组合，每个时钟周期可以完成两次64位双精度计算或4次32位单精度计算。如果一个核心没有进行浮点运算，那么另一个核心可以占用这两个128位的FMAC，在一个时钟周期完成4次双精度运算或8次单精度计算，AMD将其命名为 AVX模式。这种技术保证了“推土机”的浮点运算能力，在高性能计算中并不会因为“共享”而牺牲性能。

二、新接口新工艺

推土机处理器将采用SocketAM3 接口，941个针脚，不同于938个针脚的Socket AM3接口，其好处是可以支持DDR3-1866内存和高级节能技术，而且AM3 将是AMD的最后一代针脚栅格阵列(PGA)封装，之后将改用触点栅格阵列(LGA)，等到Fusion融合处理器降临的时候就会使用LGAAF1新接口，触点多达1591个，支持DisplayPort 1.2标准、PCI-E 3.0规范(32条信道)、四通道内存。

三、加强型内存控制器

AMD首家推出集成内存控制器，根据AMD在这一领域的经验和非常好的技术，又在这一代产品中全面提升了内存控制器的性能。首先对内存控制器在效率方面进行了针对性的重新设计和完善，因此实现30%的内存性能提升。在提升30%性能基础上，让内存支持1600MHz频率，可以获得额外20%的性能。两项加起来，可以实现内存控制器50%吞吐量提升。

四、同时支持AVX指令和SSE指令

FLEX FP是AMD至今为止最有创新意义的浮点计算技术，每一个模块都有一个FLEXFP进行浮点运算。如果使用传统128位编码，意味着每个核会有单独的浮点运算单元。与友商相比，如果在128位编码前提下，AMD所执行的数量多一倍。如果是256位AVX编码，Bulldozer可以把两个浮点运算单元放在一起执行。所以在256位编码执行模式下，与友商比较，执行的数量是一样的。但是Bulldozer有一个非常大的优势，就是可以同时执行256位AVX指令和SSE指令。而友商就不能做到这点，他们只能在AVX或SSE中选择其一，这样的优势能够让Bulldozer在高性能计算、媒体编解码以及在一些技术型运算方面有更高的性能。

五、更先进的电源管理技术

每个模块内第二个整数核心所需要的电路只占总核心面积的12%，从芯片级别上讲这只会给整个内核增加5%的电路。更多的核心、更少的空间，这显然有利于提高单位功耗、单位成本的性能。能耗大小是由被通电时钟数量决定的，它取决于执行一个普通指令（运算）需要让多少晶体管处于通电状态。在最大时钟供电的百分比下，正常应用状态和闲置状态下，Bulldozer都具有非常好的能耗表现。同时在各能耗单位上进行了优化，可以在各种单位下进行电源关闭。高性能运算能耗之所以高，主要是由于浮点运算，而一般应用运算主要是在执行单元消耗得最高。同时还有闲置状态下，AMD的技术可以做到对于那些完全用不着的核，把电源完全关闭。AMD产品有一个大转型，AMD推出了新插槽，2011年推出的推土机可以使用2010年的插槽。而友商为推出新平台，同时推出了新插槽，这也使得AMD更占优势。

总结：推土机重点改进的地方包括功耗/核心面积效率、新的ISA支持、核心扩展性、模块化设计理念，有望显著改善单位功耗和面积的性能。

*文章为作者独立观点，不代表造价通立场，除来源是“造价通”外。

关注微信公众号造价通（zjtcn_Largedata），获取建设行业第一手资讯

造价通

造价通

建设工程知识

推土机架构崭新技术

热门推荐

相关阅读