三级缓存

三级缓存

为读取二级缓存后未命中的数据设计的缓存
我们把CPU比喻成一个大型加工总部,内存为部件存储大仓库,而缓存就是总部与大仓库之间的小仓库,离CPU较近的小仓库是一级缓存,其次依次为二级缓存和三级缓存,当加工总部需要加工某个成品时候需要很多部件,这个时候缓存就是把所需要的部件提前从内存调出,存储在小仓库内,当总部加工需要某个部件时候就可以直接从最近的小仓库提取,就不必大费周章去内存大仓库调取,缓存的大小就相当于小仓库存储容量大小,他越大存储的东西就越多,比如这个成品需要100个部件,如果缓存仓库容量大就可以直接将100个部件全部提取放在缓存仓库,如果缓存较小那么所存储的部件只能一次提取七八十个,那剩余的30个就需要直接去内存调取,会影响整个加工时长,所以缓存大小直接关系读取速度。
    中文名:三级缓存 外文名:Cache 分类:外置、内置 原理:保留一份从慢速储存装置读取数据

简介

三级缓存是为读取二级缓存后未命中的数据设计的—种缓存,在拥有三级缓存的CPU中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效率。其运作原理在于使用较快速的储存装置保留一份从慢速储存装置中所读取数据且进行拷贝,当有需要再从较慢的储存体中读写数据时,缓存(cache)能够使得读写的动作先在快速的装置上完成,如此会使系统的响应较为快速。

三级缓存,它的构造和一级缓存一样,是数据的输出缓存,作为输出接口与外部计算机进行通信。为了不使数据在输入缓存丢数,设定输入的高速数据在输入缓存中达到10Byte后,就会存入二级缓存,使容量更大的二级缓存作为主要的存储缓存;而只有接到读数请求后,二级缓存才会将数据写入输出缓存,输出缓存中有512Byte数据时,数据就会上传到计算机,所以将输入和输出缓存容量设置为2KByte,缓存容量有较大的冗余量,不会存在溢出问题。

缓存介绍

电脑缓存是当cpu在读取数据的时候,先是从缓存文件中查找,然后找到之后会自动读取,再输入到cpu进行处理,当然如果没有在缓存中找到对应的缓存文件的话,那么就会从内存中读取并且传输给cpu来处理。当然这样的话需要一定的时间所以会很慢。等cpu处理之后,就很快把这个数据所在的数据块保存在缓存文件中,这样的话在以后读取这项数据的时候就直接在缓存中进行,不要重复在内存中调用并读取数据了。

缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是出于CPU芯片面积和成本的因素来考虑,缓存都很小。

缓存分类

一级缓存都内置在CPU内部并与CPU同速运行,可以有效的提高CPU的运行效率。一级缓存越大,CPU的运行效率越高,但受到CPU内部结构的限制,一级缓存的容量都很小。

二级缓存,它是为了协调一级缓存和内存之间的速度。cpu调用缓存首先是一级缓存,当处理器的速度逐渐提升,会导致一级缓存就供不应求,这样就得提升到二级缓存了。二级缓存它比一级缓存的速度相对来说会慢,但是它比一级缓存的空间容量要大。主要就是做一级缓存和内存之间数据临时交换的地方用。

三级缓存是为读取二级缓存后未命中的数据设计的—种缓存,在拥有三级缓存的CPU中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效率。其运作原理在于使用较快速的储存装置保留一份从慢速储存装置中所读取数据并进行拷贝,当有需要再从较慢的储存体中读写数据时,缓存(cache)能够使得读写的动作先在快速的装置上完成,如此会使系统的响应较为快速。

三级缓存分类

Cache(三级缓存),分为两种,早期的是外置,以后的升级产品都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏软件都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。如具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。

其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MBL3缓存的Itanium2处理器,和以后24MBL3缓存的双核心Itanium2处理器。

但基本上L3缓存对处理器的性能提高显得不是很重要,如配备1MBL3缓存的XeonMP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。

二级缓存价格

首先来算一笔小账(2009年02月),关于Intel处理器的二级缓存:

二级缓存512K的赛扬双核E1200只要270元,二级缓存1M的奔腾双核E2140售价为370元,需要花费100元来购买这额外的512K缓存;二级缓存2M的酷睿2E4300或者奔腾双核E5200的售价在550元以上,这就意味着得再出200元来购买这额外的1M二级缓存;二级缓存3M的酷睿2E7200售价750元,又得掏出200元来购买这额外的1M二级缓存;二级缓存4M/6M的酷睿2系列处理器依次类推……

不管酷睿2、奔腾双核还是赛扬双核,它们的核心架构其实是完全相同的,频率可以随意更改,唯一不同的就是二级缓存。可以毫不夸张地说,Intel就是在卖二级缓存,200块钱1M。

事实上历年来Intel都是通过二级缓存的大小来划分产品线,初期只有奔腾和赛扬两种规格,到了酷睿2时代Intel达到了登峰造极的境界:仅仅是双核产品就拥有512K、1M、2M、3M、4M、6M多达六个版本,四核产品也有4M、6M、8M、12M四个版本,令人眼花缭乱!Intel细分产品线的策略在每个价位都提供了优秀的产品,但也给广大用户制造了前所未有的困惑:到底多大二级缓存才够用?

二级缓存发展

纵观英特尔处理器的发展,且不论核心架构如何改变,以级数增长的二级缓存是最直观的。奔腾4时代0.18微米工艺的Willamette拥有256K二级缓存,0.13微米的Northwood核心拥有512K,后期0.09微米的Prescott一度增大到1M。到了酷睿时代,在架构发生了翻天覆地的变化的同时,65纳米工艺让二级缓存再次翻倍,即便是刚推出时低端酷睿的代表Allendale核心,二级缓存也达到了2M,高端酷睿更是拥有4M的二级缓存。进入45nm工艺后,二级缓存的容量进一步加大,高端E8X00系列二级缓存达到了惊人的6M,低端E7X00也达到了3M之多,至此Intel从512K到6M甚至12M实现了二级缓存的“无缝衔接”。

市场中没有永远的落后者,当AMD进入45nm时代,PhenomII的到来,AMD也能通过核心数量和缓存的搭配,设计出定位不同市场的CPU。

对性能的影响

而三级缓存对性能影响时高时低。在游戏方面,提升三级缓存的容量对游戏的性能影响很大,虽然对一般家用机没有什么用,但是如果是网吧机或者是发烧机提升三级缓存的容量还是会有显著的性能提升的。虽然三级缓存也能为PC带来显著的性能提升,但毕竟三级缓存是作用于服务器的,对PC来说,三级缓存还是只能做个辅助作用,在其他参数相同的情况下,三级缓存容量越大,则性能更好,如果其他参数不相同的话,这时三级缓存的作用就不明显了。

不管三级缓存的作用大不大,它毕竟也是为电脑发展作出贡献的参数之一。

发展历程

最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MBL3缓存的Itanium2处理器,和以后24MBL3缓存的双核心Itanium2处理器。

但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MBL3缓存的XeonMP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比单纯增加缓存带来更有效的性能提升。

纵观AMDPhenom处理器的发展,核心架构的改进相对有限,而三级缓存的变化是最直观的。从早期Phenom的2MB三级缓存,猛增至PhenomII的6MB三级缓存,而为了市场的需要,又推出了采用PhenomII架构但没有三级缓存的AthlonX4。而AMD处理器独有的双核、三核、四核架构,加上缓存的不同搭配,一时间,AMD处理器呈现出门丁兴旺的景象。

对于AMD的用户来说,多是追求性价比的用户,而AMD处理器这样的现象,对用户既是好事也是坏事,好是用户的选择更多了,坏的是用户对CPU的选择无所适从。而细细观察,AMD处理器百龙争宠的现象,无外乎是核心与缓存搭配的结果。

与65nmPhenom相比,新一代45nmPhenomII最大的变化就是升级到了45nmSOI沉浸式光刻生产工艺,好处就是主频更高、功耗更低、集成度更高,特别是三级缓存从2MB猛增到了6MB!

三级缓存翻了三倍,自然需要付出一定的代价,通过Phenom和PhenomII芯片示意图的对比,就能略知一二了:

Brcelona/Agena集成了4.68亿个晶体管,核心(Die)面积大约285平方毫米,Shanghai/Deneb的晶体管增加了62%,多达7.58亿个,但核心面积却减小了9.5%,只有258平方毫米,新工艺的好处可见一斑。

晶体管数量增加如此之多主要就是因为三级缓存的大幅扩容,这部分在整个核心里的面积比例也从大约六分之一提高到了足有三分之一。

其它

AMD关于三级缓存的态度

第一,三级缓存容量在服务器领域的作用更明显,不过如果服务器和桌面处理器采用不同的架构,必然会提高生产难度和成本,故而带到了桌面上;

第二,在桌面上,三级缓存从2MB增加到6MB可以带来大约5%的性能提升,实际测试也证明了这一点;

第三,从前边的数据看出,三级缓存增加了两倍,但得益于生产工艺的改进,核心面积反而更小了,成本也更低。

熟悉IntelNehalemCorei7(酷睿i7)处理器的人一定想到了,Intel也使用了同样的大容量共享三级缓存设计,且容量多达8MB,也占据了整个核心面积的三分之一左右,不同之处在于Corei7每核心一级缓存和二级缓存只有64KB和256KB,都比Phenom/PhenomII少一半。

有趣的是,同样基于45nm工艺的Corei7集成了7.31亿个晶体管,比PhenomII略少,但核心面积却稍大一些,为263平方毫米。

从成本的角度来算一笔帐,通过PhenomIIX4的芯片结构示意图可以看出,三级缓存所占芯片面积比两颗核心以及L1L2加起来还要多,如此一来即便是屏蔽了一颗核心的PhenomIIX3,其成本也并不低,这对于主打性价比路线的AMD来说,利润损失会比较大。

于是,AMD在发布PhenomIIX4、X3处理器之后,也在积极准备定位主流中低端的产品,用以取代征战多年的Athlon64X2系列。由于L3成本较高,因此AMD把PhenomIIX4的三级缓存彻底删去(注意不是屏蔽),AthlonX4便与大家见面了。

如此一来,人们就可以通过对比评测,轻松了解到AMD的PhenomII架构处理器中,6ML3对性能的贡献有多大,也能提前了解拥有完整L3但却少一颗核心的PhenomIIX3强呢,还是没有L3的但却有四颗核心的AthlonX4强?相信很多朋友都会挺感兴趣的。

AMD已上市的PhenomII920(6ML3)和Phenom9850(2ML3),还有一颗神秘的没有L3的AthlonX4工程样品,让他们都工作在200*14=2.8GHz频率下,这样就能直观的对比6M/2M/0M三级缓存所造成的性能差异。

另外还加入了刚刚发布的PhenomIIX3720处理器,它拥有完整的6M三级缓存,但少一颗核心,这样可以反映出多一颗核心的贡献大还是6ML3的贡献更大?测试结果表明,从CPU架构上看,缓存对性能的影响很大,但AthlonX4的表现,尤其是在大量运算过程中,力压上代拥有完整3级缓存的9850,内存带宽的优势不言而喻。

Intel6(16MB三级缓存)核处理器

首先推向市场的是高端桌面PC处理器品牌酷睿i7和针对高能效服务器市场的Nehalem-EP,预计2009年第四季度即可上市。随后,新架构产品会陆续推出,包括针对可扩展服务器市场的Nehalem-EX,桌面市场的Havendale和Lynnfield,移动市场的Auburndale和Clarksfield,预计都在2009年下半年登场。

下一代Core微架构(Nehalem)处理器均从4核起跳,但同时采用了Hyper-Threading技术,可同时处理8个线程。Corei7支持TurboMode和PowerGates技术,在不需要多线程运算时,可令闲置核心完全关闭。各个核心可以工作在不同的电压/频率下,单独提高某一核心频率的TurboMode模式可显著提升单线程应用性能。

Intel还同时发布了首款6核心处理器,针对多路服务器市场的“Dunnington”XeonX7460,内建16MBL3缓存,在2008年9月上市,是Intel在转向Nehalem微架构之前的最后一颗45nm酷睿2微架构处理器。采用该处理器的服务器机型已经打破了多项世界纪录,包括8路48核的IBMSystemx3950M2服务器在TPCBenchmarkC数据库测试中首次突破100万tpmC,4路系统惠普ProlianTDL580G5打破TPC-C纪录,戴尔PowerEdgeR900打破TPC-E纪录,SunFireX4450打破SPECjbb2005纪录,富士通西门子PRIMERGYRX600S4打破SPECint_rate2006纪录。

无三级缓存AMD45nm处理器

在工艺进步、技术完善后,AMD的45nm新桌面处理器将拥有齐全的五个子系列,其中拥有三级缓存的属于PhenomII品牌,精简掉三级缓存的则仍沿用Athlon(不知道为何不是AthlonII)。至于Sempron,很快就会淘汰了。

最高端的“PhenomIIX4900/800”系列四核心代号Deneb,二级缓存4×512KB,三级缓存前者6MB、后者精简到4MB。这两个系列都将于明年1月份率先发布,其中首批两款AM2+接口的PhenomIIX4940/920会在1月8日的CES2009大展上首发,之后的全部改用AM3接口。

三核心系列“PhenomIIX3700”代号Heka,二级缓存3×512KB,三级缓存为完整的6MB,将在明年2月份跟进。

除了这两个系列,AMD还准备了没有三级缓存的版本,而且在设计之初就没有加入三级缓存,而不是简单的屏蔽版本,不会造成浪费。

其中四核心将是“AthlonX4600”系列,代号Propus,二级缓存4×512KB,三核心是“AthlonX3400”系列,代号Rana,二级缓存3×512KB,二者都会在明年4月份登场。

最后是代号Regor的“AthlonX2200”系列双核心,二级缓存2×1MB,比其它系列多出一倍,不过发布时间也最晚,要到明年6月才会推出,目的是避免和现有的旧架构型号产生冲突。

芯片组方面,现在的AMD7系列主板在更新BIOS就能支持新处理器,具体视主板厂商的技术支持而定。另外AMD将在2009年上半年推出新的8系列整合芯片组,其中RS880和RS880C搭配SB750南桥,RS880D和RS890搭配下一代SB800。

一级、二级和三级缓存谁更重要

一级最重要,但是现在CPU的一级缓存几乎都一样,所以忽略

二级缓存的话对于Intel的CPU是很重要的,Intel的CPU的二级缓存越大性能提升非常明显,而AMD的CPU虽然二级缓存也很重要,但是二级缓存大小对AMD的CPU的性能提升不是很明显。

三级缓存其实只是做了个辅助的作用,除了服务器,其实对大多数家庭机没什么用的,内存还是很重要的,但如果运行大型程序或游戏来说三级缓存就显得重要了,目前新型CPU已经有三级缓存了。

所以说现在衡量CPU性能除了频率外,还有一个核心数量,再到缓存的大小,从理论上讲,二级缓存越大处理器的性能越好,但这并不是说二级缓存容量加倍就能够处理器带来成倍的性能增长。2006年,CPU处理的绝大部分数据的大小都在0-256KB之间,小部分数据的大小在256KB-512KB之间,只有极少数数据的大小超过512KB。到2009年已经有1M,2M的了。所以只要处理器可用的一级、二级缓存容量达到256KB以上,那就能够应付正常的应用;512KB容量的二级缓存已经足够满足绝大多数应用的需求。

主频、二级缓存和三级缓存哪个更重要

缓存的工作原理是当CPU要读取一个数据时,首先从缓存中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不必再调用内存。

正是这样的读取机制使CPU读取缓存的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在缓存中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间,也使CPU读取数据时基本无需等待。总的来说,CPU读取数据的顺序是先缓存后内存。

cpu的二级缓存和三级缓存的大小,并不是衡量cpu的性能的唯一标准,还得看cpu的主频,制做流程,比如说45纳米的就比65纳米的好,还要稍微注意一下它支持的指令集,还得看是谁的产品,二级缓存对于intel的产品来说很重要但二级缓存对于AMD来说就不像intel那么重要,因为AMD除了有二级缓存之外还有三级缓存。

要说主频、二级缓存和三级缓存哪个更重要,这个问题完全还要看你使用电脑追求什么了,主要执行什么任务。主频高运算速度快,二级缓存(L2)和三级缓存(L3)起到内存和CPU之间的缓冲作用,缓解内存和CPU速度不匹配问题会影响到CPU执行的效率。所以大的L2、L3在CPU长时间大量数据处理的时候效率会比较高。高主频在短时间内少量数据的处理上会比较快,其实3项这都很重要,哪一项达不到一定标准都会出现瓶颈效应。

IntelXeon7100系列CPU(16MB三级缓存)

Intel正式发布了针对高端服务器的最新双核Xeon处理器,代号Tulsa的Xeon7100系列。该处理器依然基于上一代NetBurst架构,但在性能和功耗表现方面都有不小的改进。

Xeon7100系列CPU配置

Xeon7100系列CPU核心代号为Tulsa,双核心设计,每个核心配备了1MBL2(二级)缓存,16MBL3(三级)缓存。该处理器还支持超线程(HT:Hyper-Threading)、虚拟化(IntelVirtualizationTechnology)以及Intel缓存安全技术(CacheSafeTechnology),3.0GHz主频以上的Xeon7100系列处理器TDP功耗为150W,3.0GHz以下的TDP为95W。

Xeon7100系列CPU规格

CPU编号主频FSBL2缓存L3缓存千颗价格

7140M3.40GHz800MHz2×1MB16MB1980

7140N3.33GHz667MHz2×1MB16MB1980

7130M3.20GHz800MHz2×1MB8MB1391

7130N3.16GHz667MHz2×1MB8MB1391

7120M3.00GHz800MHz2×1MB4MB1177

7120N3.00GHz667MHz2×1MB4MB1177

7110M2.60GHz800MHz2×1MB4MB856

7110N2.60GHz667MHz2×1MB4MB856

Xeon7100系列处理器支持667和800MHzPSB总线,与8501芯片组兼容,现有的服务器平台可以很轻松的升级到新处理器。此外Intel公司表示,65nm工艺发展的十分顺利,目前65nm产品的出货比例已经超越90nm。

相关词条

相关搜索

其它词条