闪电十一人游戏手机版:Intel处理器微架构和核心代号解析 Bloomfield,Lynnfield,Clarkdale,Sand

来源:百度文库 编辑:九乡新闻网 时间:2024/04/20 04:05:45
Intel处理器微架构和核心代号解析 Bloomfield,Lynnfield,Clarkdale,Sand...

Bloomfield核心:首次整合内存控制器

 

    Intel将新一代的SandyBridge处理器称作是第二代Core架构微处理器,因此在详细介绍SandyBridge处理器的核心架构之前,我们有必要对第一代Core架构微处理器做一个详细的回顾,这样才能深入了解Intel近年来是如何改良处理器微架构的。

    第一代Core架构微处理器分为三个版本:Bloomfield、Lynnfield、Clarkdale(六核心版的Gulftown与Bloomfield没有本质不同,因此不做介绍),这三颗CPU核心一颗比一颗的集成度高,下面我们就一一解读:

回顾:Bloomfield核心首次整合内存控制器

    2008年10月,Intel正式发布了Nehalem架构的Core i7 965/940/920三款处理器以及X58芯片组,这是Intel第一款整合内存控制器和QPI总线的产品,因此备受关注。

    i7 9XX系列处理器是基于Nehalem架构的首款产品,核心研发代号是Bloomfield,采用了45nm工艺制造,是原生四核心设计,集众多先进技术于一身:

1. 超线程技术回归,四核八线程大幅提升CPU的多任务和多线程计算能力;

2. 整合三通道DDR3内存控制器,带宽大幅提升、延迟大大下降,从此内存不再是瓶颈;

3. QPI总线取代FSB总线,用以连接北桥芯片,Core 2架构最大的瓶颈被消除;

4. 采用大容量共享式三级缓存设计,较少数据等待延迟,多核应用效率提升。

i7 9XX系列的主要特点:四核心、八线程、三通道、三级缓存

配套芯片组X58+ICH10R,接口类型LGA1366

    与之搭配的芯片组,只有X58这一款。X58芯片组为传统的南北桥设计,北桥通过QPI总线与CPU相连,内部整合了36条PCI-E 2.0通道,可以灵活的分配为两条x16或者四条x8插槽,供多显卡使用。

    而南桥方面使用的依然是P45芯片组当中的ICH10R,通过DMI总线与北桥相连,基本功能相信大家都比较熟悉,就不再赘述。

Bloomfield核心Core i7 9XX系列CPU的特点总结:

    四核八线程、三通道内存还有可以支持多显卡互联的X58芯片组,这些就是Bloomfield核心Core i7 9XX系列CPU的主要特点。

    三通道内存带来的不仅是很高的内存带宽,更重要的是六条插槽全插满的话,可以支持最大12/24GB的海量内存容量,这对有特殊需求的用户很有吸引力。

    X58北桥是此前整合了最多PCI-E 2.0通道的芯片组,对于需要强大游戏性能或者通用计算性能的用户来说,自然是插越多显卡越好,因此X58是这类用户的不二之选。

    总的来说,i7 9XX搭配X58,是Intel为追求顶级性能玩家提供的终极选择,虽然它无论CPU主板还是内存都价值不菲,而且功耗很大,但除此之外别无它选。

 

Lynnfield核心:首次整合PCI-E控制器

 

回顾:Lynnfield核心首次整合PCI-E总线控制器

 

    Bloomfield核心的Core i7 9XX系列虽然性能强大、功能完备,但由于X58主板和三条内存成本太高,难以普及。于是Intel准备推出简化版的Lynnfield核心,这就是Core i7 8XX和i5 7XX系列。

 

Lynnfield核心示意图

    Lynnfield相比Bloomfield,在处理器内核部分几乎没有任何改动,同样是45nm工艺、原生四核心设计、支持超线程(仅限i7)、三级缓存容量也保持8MB,它也整合了内存控制器和QPI总线,但删去了一条内存通道,成为主流的双通道设计,QPI总线也删去了一条,仅保留一条。

Lynnfield与Bloomfield的L1/L2/L3完全相同

    事实上,对于大多数普通用户来说,三通道内存的带宽过剩,因此删去一条之后,性能并没有多少损失。另外Bloomfield内置的两条QPI总线是给多CPU互联之用,而在民用市场基本完全闲置,只有一条QPI总线用来连接北桥,因此删掉一条没有任何影响。

简化成双通道之后,Lynnfield的针脚数量和封装面积缩小不少

    Bloomfield已经整合了传统北桥最重要的功能——内存控制器,所以X58北桥当中就只剩下了PCI-E控制器。Lynnfield核心由于定位较低一些,考虑到大多数主流用户并不需要多显卡互联,因此Intel索性将北桥当中剩余的模块——PCI-E控制器简化之后(只有16条通道),全都整合在了CPU当中。

    正因为整合了PCI-E控制器的关系,Lynnfield的晶体管数以及核心面积都要比Bloomfield大,所以Core i7 8XX处理器的售价比相近频率的Core i7 9XX还要贵。好在P55主板要比X58便宜,而且双通道内存显然比三通道便宜,另外不支持超线程技术的i5 7XX售价还算厚道,因此很受欢迎。

配套芯片组P55,接口类型LGA1156

    通过Intel官方Lynnfield核心示意图来看,处理器与芯片组之间居然没有使用QPI、而是通过DMI总线相连。要知道QPI总线带宽高达25GB/s,而DMI仅有2GB/s。

Intel官方的这张示意图让很多人产生误解

    事实上在Lynnfield核心内部,除了整合了内存控制器外,Intel连PCI-E控制器也整合了进去(因此上图显卡直接与CPU相连),这就相当于整颗北桥都被CPU吃掉了,连接CPU与北桥的QPI总线自然也不会幸免。如此一来,CPU将直接与“南桥”相连,他们之间的总线叫做DMI。

    也就是说,Lynnfield内部还是整合了QPI总线的,虽然只有一条,这一条QPI总线用以连接CPU核心部分与PCI-E控制器部分。Bloomfield核心的QPI总线频率可以随便超,而Lynnfield核心的QPI被锁定,其实没有任何关系,因为QPI的唯一用途就是连接北桥,内存走的是直连通道已经不经过QPI总线了,因此超频QPI不会有什么性能提升。

    P55是单芯片设计的芯片组,其本质上就是一颗南桥,功能和ICH10R没有太大区别,既不支持SATA3.0也不支持USB3.0,而且南桥中的PCI-E通道是落后的1.0版本。要知道Lynnfield核心内部整合的PCI-E 2.0通道只有16条,只能满足单显卡或者双显卡的需要,此时如果用户有需要使用高速的扩展设备(比如USB3.0扩展卡)的话,P55南桥提供的PCI-E 1.0接口就成为了最大瓶颈。

Lynnfield核心Core i7 8XX和i5 7XX系列CPU的特点总结:

    在CPU核心部分,Lynnfield与Bloomfield可以说没有任何区别,它最大的特点就是外围模块:双通道DDR3内存、整合PCI-E控制器,只支持双x8带宽的双卡互联。

    i7 8XX和i5 7XX的唯一区别是超线程,i5被人为的屏蔽了HT功能,四核心四线程,并行计算性能损失不少,但单核效能不变,因此非常适合游戏玩家。

    由于CPU整合了整颗北桥的关系,P55芯片组其实就是一颗南桥芯片,再加上少了一条内存通道,因此Lynnfield+P55平台的整体功耗要比Bloomfield+X58平台低很多。

    整套平台成本较低、加上超低的功耗和发热,Lynnfield+P55平台成为了主流中高端玩家最喜爱的配置。

Clarkdale核心:CPU首次整合GPU

 

回顾:Clarkdale核心CPU首次整合GPU

    显然,四核心的Lynnfield还不够亲民,主流市场依然是双核心的天下,所以双核心的Clarkdale诞生了,这颗核心也拥有很多亮点:首次使用32nm工艺、首次整合GPU,但其架构非常特殊,不同于之前的任何一款产品。

Clarkdale核心:双芯片封装、内置GPU设计

Clarkdale核心处理器封装示意图

    Clarkdale核心包括CPU和GPU两个部分,CPU部分使用了新一代32nm工艺制造,是双核心四线程设计;GPU部分就是传统意义上的北桥,为45nm工艺制造,内含双通道DDR3内存控制器、PCI-E控制器和集成显卡

Clarkdale的北桥(GPU)和CPU部分示意图

    CPU部分和GPU部分是各自独立的,微观上通过QPI总线相连,宏观上被封装在了一起,接口是与Lynnfield相同的LGA1156。整体上来看Clarkdale不仅整合了内存控制器和PCI-E控制器,还整合了显示核心,看似更加先进。

 

透过这张架构图,就可以更清楚的认识Clarkdale的互联架构

    实际上它的这种架构与Core 2时代的G45没有本质区别,只不过G45的北桥(GPU)在主板上,而Clarkdale的北桥被转移到了CPU内部。也就是说,Clarkdale的内存控制器并没有被真正整合在CPU核心内部,而是在北桥当中,需要透过QPI总线传输数据,这与Bloomfield/Lynnfield直连的内存控制器有本质区别,这样做的结果导致Clarkdale的内存带宽和延迟相比Core 2提升不大——显然,这不是整合内存控制器产品应有的性能表现。

    而且QPI带宽仅仅能够满足双通道DDR3-1333内存带宽的要求,没有富裕的带宽用来传输CPU和GPU之间还有其它设备的数据,因此以往Core 2平台上的FSB瓶颈依然存在。表面上看,Clarkdale什么都整合了,可实际上,它什么都没有整合。

核心微架构升级:从Nehalem到Westmere

    在CPU部分,Intel将新一代32nm工艺的处理器核心架构命名为Westmere,Westmere架构相比Nehalem架构其实并没有多少改进,唯一的变化就是提供了7组新指令集的支持,分别是6组AES指令集和1组Carryless Multiply指令,主要用于加密、解密运算。

Clarkdale的特点:双核心、四线程、4MB L3、AES指令集、整合显卡

    Clarkdale的CPU部分为双核心四线程设计,一、二级缓存没有变化,但三级缓存减少至4MB,显然双核心不需要像四核心那样超大容量的L3。减少L3的好处就是节约大量晶体管,成本和功耗发热都得到了很好的控制。

配套芯片组H55,接口LGA1156

    由于都采用了LGA1156接口,Lynnfield和Clarkdale是可以共用芯片组的,但如果想要使用Clarkdale内置的集成显卡的话,就必须使用H55芯片组,因为只有H55才支持FDI通道,用来输出显示信号:

    所以,H55和P55最大的区别就是能否支持FDI,其它南桥功能上的删减都是无关紧要的。

    另外,Lynnfield和Clarkdale内置的PCI-E 2.0通道虽然都是16条,但Lynnfield可以被拆分为两个x8通道支持双卡互联,而Clarkdale不能被拆分只能支持单个独立显卡。

    如此一来,Clarkdale处理器搭配P55主板的话,即便主板提供了两条PCI-E插槽也不能支持双卡互联,而且内置显卡无法使用。因此Clarkdale的最佳搭档还是H55。

Clarkdale核心Core i5 6XX和i3 5XX系列CPU的特点总结:

    由于Clarkdale核心的内存控制器、集成显卡、PCI-E控制器都在北桥里面,CPU与北桥虽然被封装在了一起,而且使用了新一代的QPI总线,但是瓶颈依然存在,导致内存性能和GPU性能并不理想(但相比上代Core 2平台改进还是很明显的)。

    不过,由于CPU部分使用了32nm工艺,北桥部分使用了45nm工艺(AMD的北桥还是65nm/55nm),因此Clarkdale搭配H55平台的整体功耗再创新低。而且由于CPU和北桥被封装在了一起,散热问题更容易解决,所以Clarkdale+H55成为了HTPC用户和入门级用户的最爱。

    Clarkdale核心目前有Core i5 6XX和i3 5XX两个产品线,它们之间最主要的区别就是i5支持睿频智能加速技术,默认频率较高而且可以自动超频,而i3默认频率较低且不支持睿频,但超线程技术得以保留。当然两者的价格也差很多,总的来说i3性价比超高,在中低端大受欢迎。

SandyBridge核心:首次原生整合GPU核心

 

SandyBridge核心:首次原生整合GPU核心

    Clarkdale核心虽然将CPU和GPU首次封装在了CPU基板上面,但本质上它并没有做到CPU和GPU的融合,竞争对手AMD认为Intel这种方式其实是“胶水”整合,他们自己的APU才是真正意义上的“融合”。

    与雷声大雨点小的AMD不同,Intel做事从来都是脚踏实地、按部就班的走,在AMD的APU还停留在实验室阶段之时,Intel发布了首颗真正将CPU和GPU整合到一颗芯片上面的处理器,这就是今天我们要评测的重点产品——SandyBridge。

    毫无疑问,SandyBridge相对于上代的Clarkdale来说,最大的改进就是将GPU部分真正融入了CPU核心内部,这样GPU部分也使用了先进的32nm工艺,并且可以充分利用CPU部分的大容量三级缓存以及低延迟的内存控制器,共享内存带宽,从而让集显部分获得可观的性能提升。

GPU处理单元和CPU核心被整合在了一颗芯片上面

    除了CPU和GPU真正无缝整合在一起之外,Intel还对CPU与GPU两大处理器核心分别做了优化与改进,获得更高的指令执行效率,此外整合内存控制器相比上代产品带宽将更高、延迟会更低。

    优化的核心、智能的频率控制、以及单一32nm工艺的核心,SandyBridge相比上代产品速度更快、功率更小,处理器效能被提升到新的境界!

 

SandyBridge处理器核心架构解析

SandyBridge核心架构改进总览

    Intel Core i系列处理器拥有一套革命性的体系架构,包括大容量完全共享式的三级缓存、整合的内存控制器以及QPI快速互联总线。无论是Nehalem、Westmere还是最新的SandyBridge微架构,其CPU部分的架构是基本相同的,改进的只是处理器指令集以及外围功能和控制模块。

    从Nehalem到Westmere,制造工艺从45nm进化到32nm,新增AES加密解密指令集,Turbo Boost睿频加速技术升级,从原来的多核+1倍频单核+2倍频、增强至多核+2倍频单核+4倍频。

    从Westmere到SandyBridge,制造工艺没有变化,但CPU+GPU的整合模式有了革命性的改进,两者之间不再通过QPI总线互联,而是将GPU的运算单元作为处理器内核的一部分,GPU可以直接使用CPU的三级缓存以及内存控制器,将CPU和GPU相互通讯时的延迟降到了最低。

SandyBridge处理器模块示意图

    由于GPU嵌入到了CPU内核当中,所以三级缓存以及内存控制器的共享和负载平衡算法都需要做相应的改进,SandyBridge的微架构相比上代改变是巨大的。Intel声称新的三级缓存和内存控制器相比上代产品无论带宽还是延迟都有了不小的进步,以满足CPU和GPU双方运算单元的存取需要。

SandyBridge处理器架构与功能简介

    此外,SandyBridge新增的AVX(Advanced Vector Extension)高级矢量扩展指令集并不是一般意义上的指令集扩充,它需要对CPU和GPU的运算单元底层寄存器重新设计,从而获得更强的浮点运算能力,从根本上改进CPU浮点运算能力较弱、图形和视频处理消耗资源过大的现状,后文中笔者会详细介绍AVX指令集的威力。

    当然,SandyBridge的Turbo Boost睿频加速技术也升级到了2.0版本,与Westmere微架构相比,自动超频幅度更大,对于负载的判定更加准确,而且可以智能的分配CPU和GPU的负载,同时对CPU和GPU进行超频。