许多网友都非常关注Turbo Boost功能为例:最先发布的酷睿i7900(Core i7 900)系列处理器旗舰型号Core i7 965处理器所具备的Turbo Boost功能,幅度由3.2GHz--3.46GHz,而Lynnfield核心的Core i7处理器高端型号,则可以由2.93GHz起跳提升至3.6GHz,这样的幅度确实令人感到振奋。下面重新回顾一下基于Nehalem架构设计 的Lynnfield核心所具备的几个重要的特性。
一:通吃单与多线程处理的Turbo
毫无疑问,Turbo Boost技术是针对当前应用程序在多核心处理器上具备不同表现的现状所开发的一项重要技术。
Turbo Boost,顾名思义,可以在原先的性能水平上获得额外的提升,该技术的基础是来自Nehalem架构中分布广泛的节能环节及核心智能动态调节的设计方式。对于INTEL传 统的多核心处理器,无论其是否被程序所充分调用,多个核心通常都处于同步的频率状态,即使某个程序只能使用到四核心处理中的一个核心,该核心也只能运作在 标准的状态下,其他核心即使维持在同样的频率下,也无法对其构成任何协助。
而Turbo Boost技术改变了这种状况。得益于这项技术的加入,无论所使用的应用程序对于多核心处理器的适应性表现如何,都可以获得相应的性能提升。如果所运行的软件可以充分调用到所有的核心,则四颗核心可以运作在标准的频率之下,如果所运行的软件只可以调用到四颗核心中的两个核心,则Nehalem 架构允许处理器智能的暂时关闭(以极低的能耗运作,接近关闭)其余两颗空闲的核心,降低处理器的总能耗及发热量,而根据处理器的能耗及发热量自动调高另外 两颗“繁忙”核心的频率,让程序运作的更快,如果该程序是更加极端的针对单核心设计,则Nehalem架构也允许处理器智能的暂时关闭处理器的其余三颗核 心,而集中力量提升该“繁忙”的核心的最高频率,最大化的提升该软件的运行效率。
这种分档式的Turbo Boost技术可以让Nehalem架构处理器在面对各类应用软件时都能得心应手,以往的多核无用论声音在基于Nehalem架构制造的Bloomfield核心与Lynnfield核心Core i7/i5处理器上,不再适用。
应该说,这样的设计思路原本并不复杂,但能够真正的实现智能化调节且不对处理器的运作造成干扰则需要良好的设计功底与制造实力作为支撑、特别值得一 提的是Intel45纳米制造工艺极其优秀的能耗控制及其业界领先的晶体管切换速度,保证了Turbo Boost技术在实现的同时得以真正的实现智能化,并且核心工作状态的切换速度极快,所有的变化均在极短的时间内完成,用户在操作中也不会察觉。
由于很多软件还优化不到四线程或者八线程,只支持双线程,甚至单线程运行。如果旧式四核心处理器,要么一齐降低频率,降低功耗;要么一齐工作,一齐频率增加,功耗增加较多;而现在Nehalem微架构加入英特尔® 智能加速技术(Intel® Turbo Boost)这个功能后,则能令日常支持双线程的软件运行时,其他两个核心频率降低,在不影响TDP(最大功耗)的情况下,把正在工作的双核心频率超上去,达到更快的速度;如果该软件只支持单线程处理的话,则3个核心会同时降低频率,在不影响TDP的情况下,把正在工作的单核心频率超得更高一些,达到单核心处理最快的效果。不浪费CPU性能和能源。
二:新一代超线程“SMT”技术
SMT(Simultaneous Multi-Threading)技术可以说是INTEL早前超线程技术(Hyper-Threading)的重大革新与延续。如果说在早前的INTEL 奔腾4处理器上,超线程技术的发挥或多或少还受到限制的话,那么在Nehalem架构上,超线程技术的延续:SMT技术则展现了其所具备的惊人实力。
对于超线程技术(Hyper-Threading)应该说很多用户都不陌生,这个在奔腾四处理器上第一次出现的技术曾经在业界引发了巨大的轰动,在 一颗物理核心上可以模拟两个逻辑线程,根据处理核心执行单元的负载自动分配两个线程的执行状态,从而提升多线程软件的整体效率。
而如今,Nehalem架 构具备更多的执行单元,更宽的指令通道,更大的缓存容量,更加海量的数据带宽,改良后的SMT技术可以将充分支持多线程的执行效率再提升30%以上,这样 的效率提升对于看中多线程性能,诸如:视频压缩,视频制作,图形渲染,工业设计,数据库处理等应用的用户来说是极具诱惑力的。
在Intel的产品线规划中,基于Bloomfield核心与Lynnfield核心的Core i7处理器将独占SMT技术得到四核心八线程的应用优势,基于Lynnfield核心的酷睿i5处理器将不具备SMT技术。
三:智能缓存体系“Smart Cache
智能缓存体系的进化在Nehalem架构上可以说是非常重要的一环,正是由于智能缓存体系的重新设计,使得Intel第一款原生X86架构四核心处理器的性能在他诞生之初就得以发挥到极致,无论是单核心性能还是多核心并行性能都有可靠的保证。
Nehalem架构的一级缓存(L1 Cache)依旧延续自Core微架构,由32KB的指令缓存 32KB的数据缓存所构建。在二级缓存(L2 Cache)上,则改由与每个内核紧密结合的256KB高速缓存承担。由于与处理器内核结合的非常紧密,L1 Cache与L2 Cache连同处理器内核共同构成了Nehalem处理器的"Core"部分。而三级缓存(L3 Cache)则采取模块化设计方案,被称作"Uncore"部分,四核心的Nehalem架构处理器无论是Lynnfield核心还是 Bloomfield核心均搭配的是8MB容量的三级缓存。
Nehalem架构的整个缓存体系使用包含式(Inclusive)设计,三级缓存中包含了所有处理核心的二级缓存所存储的内容,因此当核心A所具 备的256KB二级高速缓存中不包含其所需的核心B正在处理的数据,则可以直接从L3中调取而无需查询包括核心B在内的其他核心的L2 Cache,大大缩短了缓存的延迟周期,如果在L3中也无法找到核心所需的数据,则可以直接确定其余核心的L2 Cache中也不具备,可以立即决定由内存中调取,由此大大降低了数据存取的延迟。
尽管处理器内核与三级缓存采用模块化设计组合,可以根据不同档次处理器的设计,自由添加或者增减处理器内核的数量,三级缓存的大小,但是整个缓存体系的性能表现之强悍确实令人感到惊讶。
除了智能化的设计之外,还必须提到,得益于Intel强大的半导体研发与生产功底,Intel Nehalem架构的处理器上所具备的三级缓存模块至少可以说是所有X86架构处理器所能达到的最高水平,无论在性能还是晶圆面积的控制上都毫无疑问的走在业界的前列。正是由于这样大容量低延迟的三级缓存作为后盾,Nehalem架构处理器得以在有限的晶圆面积内重整Intel X86架构处理器传统的缓存体系设计,同时但却能保证其总容量略有降低的情况下大幅提升Nehalem微架构相对于Core微架构的性能表现。