微處理器

微處理器

大規模集成電路組成的中央處理器
微處理器由一片或少數幾片大規模集成電路組成的中央處理器。這些電路執行控制部件和算術邏輯部件的功能。微處理器受到高能粒子轟擊或噪聲幹擾等惡劣環境的影響,将發生瞬态故障。這些瞬态故障可能引起軟錯誤(Soft Error),甚至失效,這将對微處理器的可靠性産生較大的影響。[1]
  • 中文名:微處理器
  • 外文名:Microprocessor
  • 别名:中央處理器
  • 含義:計算機的運算核心和控制核心
  • 領域:計算機

綜述

微處理器與傳統的中央處理器相比,具有體積小、重量輕和容易模塊化等優點。微處理器的基本組成部分有:寄存器堆、運算器、時序控制電路,以及數據和地址總線。

随着集成電路制造工藝的發展,輻射和幹擾引發的軟錯誤日益增多,從而引發的可靠性降低問題已嚴重限制現代先進微處理器的發展和應用。

自從人類1947年發明晶體管以來,50多年間半導體技術經曆了矽晶體管、集成電路、超大規模集成電路、甚大規模集成電路等幾代,發展速度之快是其他産業所沒有的。半導體技術對整個社會産生了廣泛的影響,因此被稱為“産業的種子”。中央處理器是指計算機内部對數據進行處理并對處理過程進行控制的部件,伴随着大規模集成電路技術的迅速發展,芯片集成密度越來越高,CPU可以集成在一個半導體芯片上,這種具有中央處理器功能的大規模集成電路器件,被統稱為“微處理器”。需要注意的是:微處理器本身并不等于微型計算機,僅僅是微型計算機的中央處理器。

微處理器已經無處不在,無論是錄像機、智能洗衣機、移動電話等家電産品,還是汽車引擎控制,以及數控機床、導彈精确制導等都要嵌入各類不同的微處理器。微處理器不僅是微型計算機的核心部件,也是各種數字化智能設備的關鍵部件。國際上的超高速巨型計算機、大型計算機等高端計算系統也都采用大量的通用高性能微處理器建造。

作為現代電子系統的核心,微處理器往往在電子系統的電磁兼容中扮演着重要角色。随着集成電路制造工藝的不斷進步,特征尺寸的不斷減小,微處理器的工作頻率和集成度越來越高、工作電壓越來越低,對外界電磁幹擾越來越敏感。

内部結構

16位微處理器(圖中為8086微處理器)可分成兩個部分,一部分是執行部件(EU),即執行指令的部分;另一部分是總線接口部件(BIU),與8086總線聯系,執行從存儲器取指令的操作。微處理器分成EU和BIU後,可使取指令和執行指令的操作重疊進行。EU部分有一個寄存器堆,由8個16位的寄存器組成,可用以存放數據、變址和堆棧指針、算術運算邏輯單元(ALU)執行算術運算和邏輯操作,标志寄存器寄存這些操作結果的條件。執行部件中的這些部件是通過數據總線傳送數據的。總線接口部件也有一個寄存器堆,其中CS、DS、SS和ES是存儲空間分段的分段寄存器。IP是指令指針。内部通信寄存器也是暫時存放數據的寄存器。指令隊列是把預先取來的指令流存放起來。總線接口部件還有一個地址加法器,把分段寄存器值和偏置值相加,取得20位的物理地址。數據和地址通過總線控制邏輯與外面的8086系統總線相聯系。8086有16位數據總線,處理器與片外傳送數據時,一次課傳送16位二進制數。8086具有一個初級流水線結構,可以實現片内操作與片外操作的重疊。

微處理器的分類

根據微處理器的應用領域,微處理器大緻可以分為三類:通用高性能微處理器、嵌入式微處理器和數字信号處理器、微控制器。一般而言,通用處理器追求高性能,它們用于運行通用軟件,配備完備、複雜的操作系統;嵌入式微處理器強調處理特定應用問題的高性能,主要用于運行面向特定領域的專用程序,配備輕量級操作系統,主要用于蜂窩電話、CD播放機等消費類家電;微控制器價位相對較低,在微處理器市場上需求量最大,主要用于汽車、空調、自動機械等領域的自控設備。

CPU是Central Processing Unit(中央微處理器)的縮寫,它是計算機中最重要的一個部分,由運算器和控制器組成。如果把計算機比作人,那麼CPU就是人的大腦。CPU的發展非常迅速,個人電腦從8088(XT)發展到Pentium 4時代,隻經過了二十一年的時間。

發展曆程

CPU發展已經有多年的曆史了,這期間,按照其處理信息的字長,CPU可以分為:4位微處理器、8位微處理器、16位微處理器、32位微處理器以及最新的64位微處理器,可以說個人電腦的發展是随着CPU的發展而前進的。微機是指以大規模、超大規模集成電路為主要部件,以集成了計算機主要部件——控制器和運算器的微處理器MP(Micro Processor)為核心,所構造出的計算系經過30多年的發展,微處理器的發展大緻可分為:

第一代

第一階段

(1971—1973年)通常以字長是4位或8位微處理器,典型的是美國Intel 4004和Intel 8008微處理器。Intel 4004是一種4位微處理器,可進行4位二進制的并行運算,它有45條指令,速度0.05MIPs(Million Instruction Per Second,每秒百萬條指令)。Intel 4004的功能有限,主要用于計算器、電動打字機、照相機、台秤、電視機等家用電器上,使這些電器設備具有智能化,從而提高它們的性能。Intel 8008是世界上第一種8位的微處理器。存儲器采用PMOS工藝。該階段計算機工作速度較慢,微處理器的指令系統不完整,存儲器容量很小,隻有幾百字節,沒有操作系統,隻有彙編語言。主要用于工業儀表、過程控制。

第二代

(1974—1977年)典型的微處理器有Intel 8080/8085,Zilog公司的Z80和Motorola公司的M6800。與第一代微處理器相比,集成度提高了1~4倍,運算速度提高了10~15倍,指令系統相對比較完善,已具備典型的計算機體系結構及中斷、直接存儲器存取等功能。

由于微處理器可用來完成很多以前需要用較大設備完成的計算任務,價格又便宜,于是各半導體公司開始競相生産微處理器芯片。Zilog公司生産了8080的增強型Z80,摩托羅拉公司生産了6800,英特爾公司于1976年又生産了增強型8085,但這些芯片基本沒有改變8080的基本特點,都屬于第二代微處理器。它們均采用NMOS工藝,集成度約9000隻晶體管,平均指令執行時間為1μS~2μS,采用彙編語言、BASIC、Fortran編程,使用單用戶操作系統。

第三代

第三階段(1978—1984年)即16位微處理器。1978年,Intel公司率先推出16位微處理器8086,同時,為了方便原來的8位機用戶,Intel公司又提出了一種準16位微處理器8088。

8086微處理器最高主頻速度為8MHz,具有16位數據通道,内存尋址能力為1MB。同時英特爾還生産出與之相配合的數學協處理器i8087,這兩種芯片使用相互兼容的指令集,但i8087指令集中增加了一些專門用于對數、指數和三角函數等數學計算的指令。人們将這些指令集統一稱之為x86指令集。雖然以後英特爾又陸續生産出第二代、第三代等更先進和更快的新型CPU,但都仍然兼容原來的x86指令,而且英特爾在後續CPU的命名上沿用了原先的x86序列,直到後來因商标注冊問題,才放棄了繼續用阿拉伯數字命名。

1979年,英特爾公司又開發出了8088。8086和8088在芯片内部均采用16位數據傳輸,所以都稱為16位微處理器,但8086每周期能傳送或接收16位數據,而8088每周期隻采用8位。因為最初的大部分設備和芯片是8位的,而8088的外部8位數據傳送、接收能與這些設備相兼容。8088采用40針的DIP封裝,工作頻率為6.66MHz、7.16MHz或8MHz,微處理器集成了大約29000個晶體管。

在Intel公司推出8086、8088CPU之後,各公司也相繼推出了同類的産品,有Zilog公司Z8000和Motorola公司的M68000等。16位微處理器比8位微處理器有更大的尋址空間、更強的運算能力、更快的處理速度和更完善的指令系統。所以,16位微處理器已能夠替代部分小型機的功能,特别在單任務、單用戶的系統中,8086等16位微處理器更是得到了廣泛的應用。

1981年,美國IBM公司将8088芯片用于其研制的IBM-PC機中,從而開創了全新的微機時代。也正是從8088開始,個人電腦(PC)的概念開始在全世界範圍内發展起來。從8088應用到IBM PC機上開始,個人電腦真正走進了人們的工作和生活之中,它也标志着一個新時代的開始。

1982年,英特爾公司在8086的基礎上,研制出了80286微處理器,該微處理器的最大主頻為20MHz,内、外部數據傳輸均為16位,使用24位内存儲器的尋址,内存尋址能力為16MB。80286可工作于兩種方式,一種叫實模式,另一種叫保護方式。

在實模式下,微處理器可以訪問的内存總量限制在1兆字節;而在保護方式之下,80286可直接訪問16兆字節的内存。此外,80286工作在保護方式之下,可以保護操作系統,使之不像實模式或8086等不受保護的微處理器那樣,在遇到異常應用時會使系統停機。

IBM公司将80286微處理器用在先進技術微機即AT機中,引起了極大的轟動。80286在以下四個方面比它的前輩有顯著的改進:支持更大的内存;能夠模拟内存空間;能同時運行多個任務;提高了處理速度。

最早PC機的速度是4MHz,第一台基于80286的AT機運行速度為6MHz至8MHz,一些制造商還自行提高速度,使80286達到了20MHz,這意味着性能上有了重大的進步。

80286的封裝是一種被稱為PGA的正方形包裝。PGA是源于PLCC的便宜封裝,它有一塊内部和外部固體插腳,在這個封裝中,80286集成了大約130000個晶體管。

IBM PC/AT微機的總線保持了XT的三層總線結構,并增加了高低位字節總線驅動器轉換邏輯和高位字節總線。與XT機一樣,CPU也是焊接在主闆上的。

第四代

第四階段(1985—1992年)即32位微處理器。1985年10月17日,英特爾劃時代的産品——80386DX正式發布了,其内部包含27.5萬個晶體管,時鐘頻率為12.5MHz,後逐步提高到20MHz、25MHz、33MHz,最後還有少量的40MHz産品。

80386DX的内部和外部數據總線是32位,地址總線也是32位,可以尋址到4GB内存,并可以管理64TB的虛拟存儲空間。它的運算模式除了具有實模式和保護模式以外,還增加了一種“虛拟86”的工作方式,可以通過同時模拟多個8086微處理器來提供多任務能力。

80386DX有比80286更多的指令,頻率為12.5MHz的80386每秒鐘可執行6百萬條指令,比頻率為16MHz的80286快2.2倍。80386最經典的産品為80386DX-33MHz,一般我們說的80386就是指它。

由于32位微處理器的強大運算能力,PC的應用擴展到很多的領域,如商業辦公和計算、工程設計和計算、數據中心、個人娛樂。80386使32位CPU成為了PC工業的标準。

1989年英特爾公司又推出準32位微處理器芯片80386SX。這是Intel為了擴大市場份額而推出的一種較便宜的普及型CPU,它的内部數據總線為32位,外部數據總線為16位,它可以接受為80286開發的16位輸入/輸出接口芯片,降低整機成本。80386SX推出後,受到市場的廣泛的歡迎,因為80386SX的性能大大優于80286,而價格隻是80386的三分之一。

1989年,我們大家耳熟能詳的80486芯片由英特爾推出。這款經過四年開發和3億美元資金投入的芯片的偉大之處在于它首次實破了100萬個晶體管的界限,集成了120萬個晶體管,使用1微米的制造工藝。80486的時鐘頻率從25MHz逐步提高到33MHz、40MHz、50MHz。

80486是将80386和數學協微處理器80387以及一個8KB的高速緩存集成在一個芯片内。80486中集成的80487的數字運算速度是以前80387的兩倍,内部緩存縮短了微處理器與慢速DRAM的等待時間。并且,在80x86系列中首次采用了RISC(精簡指令集)技術,可以在一個時鐘周期内執行一條指令。它還采用了突發總線方式,大大提高了與内存的數據交換速度。由于這些改進,80486的性能比帶有80387數學協微處理器的80386DX性能提高了4倍。

第五代

第5階段(1993-2005年)是奔騰(pentium)系列微處理器時代,通常稱為第5代。典型産品是Intel公司的奔騰系列芯片及與之兼容的AMD的K6系列微處理器芯片。内部采用了超标量指令流水線結構,并具有相互獨立的指令和數據高速緩存。随着MMX(MultiMediaeXtended)微處理器的出現,使微機的發展在網絡化、多媒體化和智能化等方面跨上了更高的台階。

早期的奔騰75MHz~120MHz使用0.5微米的制造工藝,後期120MHz頻率以上的奔騰則改用0.35微米工藝。經典奔騰的性能相當平均,整數運算和浮點運算都不錯。為了提高電腦在多媒體、3D圖形方面的應用能力,許多新指令集應運而生,其中最著名的三種便是英特爾的MMX、SSE和AMD的3D NOW!。MMX(MultiMedia Extensions,多媒體擴展指令集)是英特爾于1996年發明的一項多媒體指令增強技術,包括57條多媒體指令,這些指令可以一次處理多個數據,MMX技術在軟件的配合下,就可以得到更好的性能。

多能奔騰(Pentium MMX)的正式名稱就是“帶有MMX技術的Pentium”,是在1996年底發布的。從多能奔騰開始,英特爾就對其生産的CPU開始鎖倍頻了,但是MMX的CPU超外頻能力特别強,而且還可以通過提高核心電壓來超倍頻,所以那個時候超頻是一個很時髦的行動。超頻這個詞語也是從那個時候開始流行的。

多能奔騰是繼Pentium後英特爾又一個成功的産品,其生命力也相當頑強。多能奔騰在原Pentium的基礎上進行了重大的改進,增加了片内16KB數據緩存和16KB指令緩存,4路寫緩存以及分支預測單元和返回堆棧技術。特别是新增加的57條MMX多媒體指令,使得多能奔騰即使在運行非MMX優化的程序時,也比同主頻的Pentium CPU要快得多。

1997年推出的Pentium II處理器結合了Intel MMX技術,能以極高的效率處理影片、音效、以及繪圖資料,首次采用Single Edge Contact(S.E.C)匣型封裝,内建了高速快取記憶體。這款晶片讓電腦使用者撷取、編輯、以及透過網際網絡和親友分享數位相片、編輯與新增文字、音樂或制作家庭電影的轉場效果、使用視訊電話以及透過标準電話線與網際網絡傳送影片,Intel Pentium II處理器晶體管數目為750萬顆。

Pentium III處理器加入70個新指令,加入網際網絡串流SIMD延伸集稱為MMX,能大幅提升先進影像、3D、串流音樂、影片、語音辨識等應用的性能,它能大幅提升網際網絡的使用經驗,讓使用者能浏覽逼真的線上博物館與商店,以及下載高品質影片,Intel首次導入0.25微米技術,Intel Pentium III晶體管數目約為950萬顆。

與此同年,英特爾還發布了PentiumIII Xeon處理器。作為PentiumII Xeon的後繼者,除了在内核架構上采納全新設計以外,也繼承了Pentium III處理器新增的70條指令集,以更好執行多媒體、流媒體應用軟件。除了面對企業級的市場以外,Pentium III Xeon加強了電子商務應用與高階商務計算的能力。在緩存速度與系統總線結構上,也有很多進步,很大程度提升了性能,并為更好的多處理器協同工作進行了設計。

2000年推出的Pentium 4處理器内建了4200萬個晶體管,以及采用0.18微米的電路,Pentium 4初期推出版本的速度就高達1.5GHz,晶體管數目約為4200萬顆,翌年8月,Pentium 4處理理達到2 GHz的裡程碑。2002年英特爾推出新款Intel Pentium 4處理器内含創新的Hyper-Threading(HT)超線程技術。超線程技術打造出新等級的高性能桌上型電腦,能同時快速執行多項運算應用,或針對支持多重線程的軟件帶來更高的性能。超線程技術讓電腦性能增加25%。除了為桌上型電腦使用者提供超線程技術外,英特爾也達成另一項電腦裡程碑,就是推出運作頻率達3.06 GHz的Pentium 4處理器,是首款每秒執行30億個運算周期的商業微處理器,如此優異的性能要歸功于當時業界最先進的0.13微米制程技術,翌年,内建超線程技術的Intel Pentium 4處理器頻率達到3.2 GHz。

PentiumM:由以色列小組專門設計的新型移動CPU,Pentium M是英特爾公司的x86架構微處理器,供筆記簿型個人電腦使用,亦被作為Centrino的一部分,于2003年3月推出。公布有以下主頻:标準1.6GHz,1.5GHz,1.4GHz,1.3GHz,低電壓1.1GHz,超低電壓900MHz。為了在低主頻得到高效能,Banias作出了優化,使每個時鐘所能執行的指令數目更多,并通過高級分支預測來降低錯誤預測率。另外最突出的改進就L2高速緩存增至1MB(P3-M和P4-M都隻有512KB),估計Banias數目高達7700萬的晶體管大部分就用在這上。

此外還有一系列與減少功耗有關的設計:增強型Speedstep技術是必不可少的了,擁有多個供電電壓和計算頻率,從而使性能可以更好地滿足應用需求。

智能供電分布可将系統電量集中分布到處理器需要的地方,并關閉空閑的應用;移動電壓定位(MVPIV)技術可根據處理器活動動态降低電壓,從而支持更低的散熱設計功率和更小巧的外形設計;經優化功率的400MHz系統總線;Micro-opsfusion微操作指令融合技術,在存在多個可同時執行的指令的情況下,将這些指令合成為一個指令,以提高性能與電力使用效率。專用的堆棧管理器,使用記錄内部運行情況的專用硬件,處理器可無中斷執行程序。

Banias所對應的芯片組為855系列,855芯片組由北橋芯片855和南橋芯片ICH4-M組成,北橋芯片分為不帶内置顯卡的855PM(代号Odem)和帶内置顯卡的855GM(代号Montara-GM),支持高達2GB的DDR266/200内存,AGP4X,USB2.0,兩組ATA-100、AC97音效及Modem。其中855GM為三維及顯示引擎優化InternalClockGating,它可以在需要時才進行三維顯示引擎供電,從而降低芯片組的功率。

2005年Intel推出的雙核心處理器有Pentium D和Pentium Extreme Edition,同時推出945/955/965/975芯片組來支持新推出的雙核心處理器,采用90nm工藝生産的這兩款新推出的雙核心處理器使用是沒有針腳的LGA 775接口,但處理器底部的貼片電容數目有所增加,排列方式也有所不同。

桌面平台的核心代号Smithfield的處理器,正式命名為Pentium D處理器,除了擺脫阿拉伯數字改用英文字母來表示這次雙核心處理器的世代交替外,D的字母也更容易讓人聯想起Dual-Core雙核心的涵義。

Intel的雙核心構架更像是一個雙CPU平台,Pentium D處理器繼續沿用Prescott架構及90nm生産技術生産。Pentium D内核實際上由于兩個獨立的2獨立的Prescott核心組成,每個核心擁有獨立的1MB L2緩存及執行單元,兩個核心加起來一共擁有2MB,但由于處理器中的兩個核心都擁有獨立的緩存,因此必須保正每個二級緩存當中的信息完全一緻,否則就會出現運算錯誤。

為了解決這一問題,Intel将兩個核心之間的協調工作交給了外部的MCH(北橋)芯片,雖然緩存之間的數據傳輸與存儲并不巨大,但由于需要通過外部的MCH芯片進行協調處理,毫無疑問的會對整個的處理速度帶來一定的延遲,從而影響到處理器整體性能的發揮。

由于采用Prescott内核,因此Pentium D也支持EM64T技術、XD bit安全技術。值得一提的是,Pentium D處理器将不支持Hyper-Threading技術。原因很明顯:在多個物理處理器及多個邏輯處理器之間正确分配數據流、平衡運算任務并非易事。比如,如果應用程序需要兩個運算線程,很明顯每個線程對應一個物理内核,但如果有3個運算線程呢?因此為了減少雙核心Pentium D架構複雜性,英特爾決定在針對主流市場的Pentium D中取消對Hyper-Threading技術的支持。

同出自Intel之手,而且Pentium D和Pentium Extreme Edition兩款雙核心處理器名字上的差别也預示着這兩款處理器在規格上也不盡相同。其中它們之間最大的不同就是對于超線程(Hyper-Threading)技術的支持。Pentium D不支持超線程技術,而Pentium Extreme Edition則沒有這方面的限制。在打開超線程技術的情況下,雙核心Pentium Extreme Edition處理器能夠模拟出另外兩個邏輯處理器,可以被系統認成四核心系統。

Pentium EE系列都采用三位數字的方式來标注,形式是Pentium EE8xx或9xx,例如Pentium EE840等等,數字越大就表示規格越高或支持的特性越多。

Pentium EE8x0:表示這是Smithfield核心、每核心1MB二級緩存、800MHzFSB的産品,其與PentiumD8x0系列的唯一區别僅僅隻是增加了對超線程技術的支持,除此之外其它的技術特性和參數都完全相同。

Pentium EE9x5:表示這是Presler核心、每核心2MB二級緩存、1066MHzFSB的産品,其與PentiumD9x0系列的區别隻是增加了對超線程技術的支持以及将前端總線提高到1066MHzFSB,除此之外其它的技術特性和參數都完全相同。

單核心的Pentium 4、Pentium 4 EE、Celeron D以及雙核心的Pentium D和Pentium EE等CPU采用LGA775封裝。與以前的Socket 478接口CPU不同,LGA 775接口CPU的底部沒有傳統的針腳,而代之以775個觸點,即并非針腳式而是觸點式,通過與對應的LGA 775插槽内的775根觸針接觸來傳輸信号。LGA 775接口不僅能夠有效提升處理器的信号強度、提升處理器頻率,同時也可以提高處理器生産的良品率、降低生産成本。

第六代

第6階段(2005年至今)是酷睿(core)系列微處理器時代,通常稱為第6代。“酷睿”是一款領先節能的新型微架構,設計的出發點是提供卓然出衆的性能和能效,提高每瓦特性能,也就是所謂的能效比。早期的酷睿是基于筆記本處理器的。酷睿2:英文名稱為Core 2 Duo,是英特爾在2006年推出的新一代基于Core微架構的産品體系統稱。于2006年7月27日發布。酷睿2是一個跨平台的構架體系,包括服務器版、桌面版、移動版三大領域。其中,服務器版的開發代号為Woodcrest,桌面版的開發代号為Conroe,移動版的開發代号為Merom。

酷睿2處理器的Core微架構是Intel的以色列設計團隊在Yonah微架構基礎之上改進而來的新一代英特爾架構。最顯著的變化在于在各個關鍵部分進行強化。為了提高兩個核心的内部數據交換效率采取共享式二級緩存設計,2個核心共享高達4MB的二級緩存。

繼LGA775接口之後,Intel首先推出了LGA1366平台,定位高端旗艦系列。首顆采用LGA 1366接口的處理器代号為Bloomfield,采用經改良的Nehalem核心,基于45納米制程及原生四核心設計,内建8-12MB三級緩存。LGA1366平台再次引入了Intel超線程技術,同時QPI總線技術取代了由Pentium 4時代沿用至今的前端總線設計。最重要的是LGA1366平台是支持三通道内存設計的平台,在實際的效能方面有了更大的提升,這也是LGA1366旗艦平台與其他平台定位上的一個主要區别。

作為高端旗艦的代表,早期LGA1366接口的處理器主要包括45nm Bloomfield核心酷睿i7四核處理器。随着Intel在2010年買入32nm工藝制程,高端旗艦的代表被酷睿i7-980X處理器取代,全新的32nm工藝解決六核心技術,擁有最強大的性能表現。對于準備組建高端平台的用戶而言,LGA1366依然占據着高端市場,酷睿i7-980X以及酷睿i7-950依舊是不錯的選擇。

Intel Core i7是一款45nm原生四核處理器,處理器擁有8MB三級緩存,支持三通道DDR3内存。處理器采用LGA 1366針腳設計,支持第二代超線程技術,也就是處理器能以八線程運行。根據網上流傳的測試,同頻Core i7比Core 2 Quad性能要高出很多。

綜合之前的資料來看,英特爾首先會發布三款Intel Core i7處理器,頻率分别為3.2GHz、2.93GHz和2.66GHz,主頻為3.2GHz的屬于Intel Core i7 Extreme,處理器售價為999美元,當然這款頂級處理器面向的是發燒級用戶。而頻率較低的2.66GHz的定價為284美元,約合1940元人民币,面向的是普通消費者。全新一代Core i7處理器将于2013年第四季度推出。

而從英特爾技術峰會2008(IDF2008)上英特爾展示的情況來看,core i7的能力在core2 extreme qx9770(3.2GHz)的三倍左右。IDF上,intel工作人員使用一顆core i7 3.2GHz處理器演示了CineBench R10多線程渲染,結果很驚人。渲染開始後,四顆核心的八個線程同時開始工作,僅僅19秒鐘後完整的畫面就呈現在了屏幕上,得分超過45800。相比之下,core2 extreme qx 9770 3.2GHz隻能得到一萬兩千分左右,超頻到4.0GHz才勉強超過15000分,不到core i7的3分之一。core i7的超強實力由此可窺見一斑。

Core i5是一款基于Nehalem架構的四核處理器,采用整合内存控制器,三級緩存模式,L3達到8MB,支持Turbo Boost等技術的新處理器電腦配置。它和Core i7(Bloomfield)的主要區别在于總線不采用QPI,采用的是成熟的DMI(Direct Media Interface),并且隻支持雙通道的DDR3内存。結構上它用的是LGA1156接口,Core i7用的是LGA1366。i5有睿頻技術,可以在一定情況下超頻。

Core i3可看作是Core i5的進一步精簡版(或閹割版),将有32nm工藝版本(研發代号為Clarkdale,基于Westmere架構)這種版本。Core i3最大的特點是整合GPU(圖形處理器),也就是說Core i3将由CPU+GPU兩個核心封裝而成。由于整合的GPU性能有限,用戶想獲得更好的3D性能,可以外加顯卡。值得注意的是,即使是Clarkdale,顯示核心部分的制作工藝仍會是45nm。i3 i5區别最大之處是i3沒有睿頻技術。

2010年6月,Intel再次發布革命性的處理器——第二代Core i3/i5/i7。第二代Core i3/i5/i7隸屬于第二代智能酷睿家族,全部基于全新的Sandy Bridge微架構,相比第一代産品主要帶來五點重要革新:1、采用全新32nm的Sandy Bridge微架構,更低功耗、更強性能。2、内置高性能GPU(核芯顯卡),視頻編碼、圖形性能更強。3、睿頻加速技術2.0,更智能、更高效能。4、引入全新環形架構,帶來更高帶寬與更低延遲。5、全新的AVX、AES指令集,加強浮點運算與加密解密運算。

SNB(Sandy Bridge)是英特爾在2011年初發布的新一代處理器微架構,這一構架的最大意義莫過于重新定義了“整合平台”的概念,與處理器“無縫融合”的“核芯顯卡”終結了“集成顯卡”的時代。這一創舉得益于全新的32nm制造工藝。由于Sandy Bridge構架下的處理器采用了比之前的45nm工藝更加先進的32nm制造工藝,理論上實現了CPU功耗的進一步降低,及其電路尺寸和性能的顯著優化,這就為将整合圖形核心(核芯顯卡)與CPU封裝在同一塊基闆上創造了有利條件。此外,第二代酷睿還加入了全新的高清視頻處理單元。視頻轉解碼速度的高與低跟處理器是有直接關系的,由于高清視頻處理單元的加入,新一代酷睿處理器的視頻處理時間比老款處理器至少提升了30%。新一代Sandy Bridge處理器采用全新LGA1155接口設計,并且無法無LGA1156接口兼容。Sandy Bridge是将取代Nehalem的一種新的微架構,不過仍将采用32nm工藝制程。比較吸引人的一點是這次Intel不再是将CPU核心與GPU核心用“膠水”粘在一起,而是将兩者真正做到了一個核心裡。

2012年4月24日下午北京天文館,intel正式發布了ivy bridge(IVB)處理器。22nm Ivy Bridge會将執行單元的數量翻一番,達到最多24個,自然會帶來性能上的進一步躍進。Ivy Bridge會加入對DX11的支持的集成顯卡。另外新加入的XHCI USB 3.0控制器則共享其中四條通道,從而提供最多四個USB 3.0,從而支持原生USB3.0。cpu的制作采用3D晶體管技術的CPU耗電量會減少一半。

組成

微處理器由算術邏輯單元(ALU,Arithmetic Logical Unit);累加器和通用寄存器組;程序計數器(也叫指令指标器);時序和控制邏輯部件;數據與地址鎖存器/緩沖器;内部總線組成。其中運算器和控制器是其主要組成部分。

算術邏輯單元

算術邏輯單元ALU主要完成算術運算(+,-、×、÷、比較)和各種邏輯運算(與、或、非、異或、移位)等操作。ALU是組合電路,本身無寄存操作數的功能,因而必須有保存操作數的兩個寄存器:暫存器TMP和累加器AC,累加器既向ALU提供操作數,又接收ALU的運算結果。

寄存器陣列實際上相當于微處理器内部的RAM,它包括通用寄存器組和專用寄存器組兩部分,通用寄存器(A,B,C,D)用來存放參加運算的數據、中間結果或地址。它們一般均可作為兩個8位的寄存器來使用。處理器内部有了這些寄存器之後,就可避免頻繁地訪問存儲器,可縮短指令長度和指令執行時間,提高機器的運行速度,也給編程帶來方便。專用寄存器包括程序計數器PC、堆棧指示器SP和标志寄存器FR,它們的作用是固定的,用來存放地址或地址基值。其中:

A)程序計數器PC用來存放下一條要執行的指令地址,因而它控制着程序的執行順序。在順序執行指令的條件下,每取出指令的一個字節,PC的内容自動加1。當程序發生轉移時,就必須把新的指令地址(目标地址)裝入PC,這通常由轉移指令來實現。

B)堆棧指示器SP用來存放棧頂地址。堆棧是存儲器中的一個特定區域。它按“後進先出”方式工作,當新的數據壓入堆棧時,棧中原存信息不變,隻改變棧頂位置,當數據從棧彈出時,彈出的是棧頂位置的數據,彈出後自動調正棧頂位置。也就是說,數據在進行壓棧、出棧操作時,總是在棧頂進行。堆棧一旦初始化(即确定了棧底在内存中的位置)後,SP的内容(即棧頂位置)使由CPU自動管理。

C)标志寄存器也稱程序狀态字(PSW)寄存器,用來存放算術、邏輯運算指令執行後的結果特征,如結果為0時,産生進位或溢出标志等。

定時與控制邏輯是微處理器的核心控制部件,負責對整個計算機進行控制、包括從存儲器中取指令,分析指令(即指令譯碼)确定指令操作和操作數地址,取操作數,執行指令規定的操作,送運算結果到存儲器或I/O端口等。它還向微機的其它各部件發出相應的控制信号,使CPU内、外各部件間協調工作。

内部總線用來連接微處理器的各功能部件并傳送微處理器内部的數據和控制信号。

必須指出,微處理器本身并不能單獨構成一個獨立的工作系統,也不能獨立地執行程序,必須配上存儲器、輸入輸出設備構成一個完整的微型計算機後才能獨立工作。

存儲器

微型計算機的存儲器用來存放當前正在使用的或經常使用的程序和數據。存儲器按讀、寫方式分為随機存儲器RAM(Random Access Memory)和隻讀存儲器ROM(Read only Memory)。RAM也稱為讀/寫存儲器,工作過程中CPU可根據需要随時對其内容進行讀或寫操作。RAM是易失性存儲器,即其内容在斷電後會全部丢失,因而隻能存放暫時性的程序和數據。ROM的内容隻能讀出不能寫入,斷電後其所存信息仍保留不變,是非易失性存儲器。所以ROM常用來存放永久件的程序和數據。如初始導引程序、監控程序、操作系統中的基本輸入、輸出管理程序BIOS等。

I/O接口

輸入/輸出接口電路是微型計算機的重要組成部件。他是微型計算機連接外部輸入、輸出設備及各種控制對象并與外界進行信息交換的邏輯控制電路。由于外設的結構、工作速度、信号形式和數據格式等各不相同,因此它們不能直接挂接到系統總線上,必須用輸入/輸出接口電路來做中間轉換,才能實現與CPU間的信息交換。I/O接口也稱I/O适配器,不同的外設必須配備不同的I/O适配器。I/O接口電路是微機應用系統必不可少的重要組成部分。任何一個微機應用系統的研制和設計,實際上主要是I/O接口的研制和設計。因此I/O接口技術是本課程讨論的重要内容之一,我們将在第八章中詳細介紹。

總線

總線是計算機系統中各部件之間傳送信息的公共通道,是微型計算機的重要組成部件。它由若幹條通信線和起驅動,隔離作用的各種三态門器件組成。微型計算機在結構形式上總是采用總線結構,即構成微機的各功能部件(微處理器、存儲器、I/O接口電路等)之間通過總線相連接,這是微型計算機系統結構上的獨特之處。采用總線結構之後,使系統中各功能部件間的相互關系轉變為各部件面向總線的單一關系,一個部件(功能闆/卡)隻要符合總線标準,就可以連接到采用這種總線标準的系統中,從而使系統功能擴充或更新容易、結構簡單、可靠性大大提高。在微型計算機中,根據他們所處位置和應用場合,總線可被分為以下四級,如圖1.4所示。

(1)片内總線:它位于微處理器芯片内部,故稱為芯片内部總線。用于微處理器内部ALU和各種寄存器等部件間的互連及信息傳送(如圖1.3中的内部總線就是片内總線)。由于受芯片面積及對外引腳數的限制,片内總線大多采用單總線結構,這有利于芯片集成度和成品率的提高,如果要求加快内部數據傳送速度,也可采用雙總線或三總線結構。

(2)片總線:片總線又稱元件級(芯片級)總線或局部總線。微機主闆、單扳機以及其它一些插件闆、卡(如各種I/O接口闆/卡),它們本身就是一個完整的子系統,闆/卡上包含有CPU,RAM,ROM,I/O接口等各種芯片,這些芯片間也是通過總線來連接的,因為這有利于簡化結構,減少連線,提高可靠性,方便信息的傳送與控制。通常把各種闆、卡上實現芯片間相互連接的總線稱為片總線或元件級總線。

相對于一台完整的微型計算機來說,各種闆/卡隻是一個子系統,是一個局部,故又把片總線稱為局部總線,而把用于連接微機各功能部件插卡的總線稱為系統總線。局部總線是一個重要的概念,我們将在第七章中讨論。

(3)内總線:内總線又稱系統總線或闆級總線。因為該總線是用來連接微機各功能部件而構成一個完整微機系統的,如圖1.2中所示,所以稱之為系統總線。系統總線是微機系統中最重要的總線,人們平常所說的微機總線就是指系統總線,如PC總線、AT總線(ISA總線)、PCI總線等。系統總線是我們要讨論的重點内容之一。

系統總線上傳送的信息包括數據信息、地址信息、控制信息,因此,系統總線包含有三種不同功能的總線,即數據總線DB(Data Bus)、地址總線AB(Address Bus)和控制總線CB(Control Bus),如圖1.2中所示。

數據總線DB用于傳送數據信息。數據總線是雙向三态形式的總線,即他既可以把CPU的數據傳送到存儲器或I/O接口等其它部件,也可以将其它部件的數據傳送到CPU。數據總線的位數是微型計算機的一個重要指标,通常與微處理的字長相一緻。例如Intel 8086微處理器字長16位,其數據總線寬度也是16位。需要指出的是,數據的含義是廣義的,它可以是真正的數據,也可以指令代碼或狀态信息,有時甚至是一個控制信息,因此,在實際工作中,數據總線上傳送的并不一定僅僅是真正意義上的數據。

地址總線AB是專門用來傳送地址的,由于地址隻能從CPU傳向外部存儲器或I/O端口,所以地址總線總是單向三态的,這與數據總線不同。地址總線的位數決定了CPU可直接尋址的内存空間大小,比如8位微機的地址總線為16位,則其最大可尋址空間為2^16=64KB,16位微型機的地址總線為20位,其可尋址空間為2^20=1MB。一般來說,若地址總線為n位,則可尋址空間為2^n字節。

控制總線CB用來傳送控制信号和時序信号。控制信号中,有的是微處理器送往存儲器和I/O接口電路的,如讀/寫信号,片選信号、中斷響應信号等;也有是其它部件反饋給CPU的,比如:中斷申請信号、複位信号、總線請求信号、限備就緒信号等。因此,控制總線的傳送方向由具體控制信号而定,一般是雙向的,控制總線的位數要根據系統的實際控制需要而定。實際上控制總線的具體情況主要取決于CPU。

(4)外總線:也稱通信總線。用于兩個系統之間的連接與通信,如兩台微機系統之間、微機系統與其他電子儀器或電子設備之間的通信。常用的通信總線有IEEE-488總線,VXI總線和RS-232串行總線等。外總線不是微機系統本身固有的,隻有微型機應用系統中才有。

AMD CPU

K5

K5是AMD公司第一個獨立生産的x86級CPU,發布時間在1996年。由于K5在開發上遇到了問題,其上市時間比英特爾的Pentium晚了許多,再加上性能不好,這個不成功的産品一度使得AMD的市場份額大量喪失。K5的性能非常一般,整數運算能力不如Cyrix的6x86,但是仍比Pentium略強,浮點運算能力遠遠比不上Pentium,但稍強于Cyrix。綜合來看,K5屬于實力比較平均的那一種産品。K5低廉的價格顯然比其性能更能吸引消費者,低價是這款CPU最大的賣點。AMD自然不甘心Pentium在CPU市場上呼風喚雨,因此它們在1997年又推出了K6。K6這款CPU的設計指标是相當高的,它擁有全新的MMX指令以及64KB L1 Cache(比奔騰MMX多了一倍),整體性能要優于奔騰MMX,接近同主頻PⅡ的水平。K6與K5相比,可以平行地處理更多的指令,并運行在更高的時鐘頻率上。AMD在整數運算方面做得非常成功,K6稍微落後的地方是在運行需要使用到MMX或浮點運算的應用程序方面,比起同樣頻率的Pentium要差許多。

K6

K6擁有32KB數據L1 Cache,32KB指令L1 Cache,集成了880萬個晶體管,采用0.35微米技術,五層CMOS,C4工藝反裝晶片,内核面積168平方毫米(新産品為68平方毫米),使用Socket7架構。Cyrix也算是一家老資格的CPU開發商了,早在x86時代,它和英特爾,AMD就形成了三雄并立的局面。

K6-2

AMD于1998年4月正式推出了K6-2微處理器。它采用0.25微米工藝制造,芯片面積減小到了68平方毫米,晶體管數目也增加到930萬個。另外,K6-2具有64KB L1 Cache,二級緩存集成在主闆上,容量從512KB到2MB之間,速度與系統總線頻率同步,工作電壓為2.2V,支持Socket 7架構。

K6-2是一個K6芯片加上100MHz總線頻率和支持3D Now!浮點指令的“結合物”。3D Now!技術是對x86體系的重大突破,它大大加強了處理3D圖形和多媒體所需要的密集浮點運算性能。此外,K6-2支持超标量MMX技術,支持100MHz總線頻率,這意味着系統與L2緩存和内存的傳輸率提高近50%,從而大大提高了整個系統的表現。作為Cyrix公司獨自研發的最後一款微處理器,Cyrix MⅡ是于1998年3月開始生産的。除了具有6x86本身的特性外,該微處理器還支持MMX指令,其核心電壓為2.9V,具有256字節指令;3.5X倍頻;核心内集成650萬個晶體管,功耗20.6瓦;64KB一級緩存。

K6-Ⅲ

AMD于1999年2月推出了代号為“Sharptooth”(利齒)的K6-Ⅲ,它是該公司最後一款支持Super 7架構和CPGA封裝形式的CPU,采用0.25微米制造工藝、内核面積是135平方毫米,集成了2130萬個晶體管,工作電壓為2.2V/2.4V。

Athlon(K7)

相對于K6-2而言,K6-Ⅲ最大的變化就是内部集成了256KB二級緩存(新賽揚隻有128KB),并以CPU的主頻速度運行。K6-Ⅲ的這一變化将能夠更大限度發揮高主頻的優勢。此外,該微處理器還帶有64KB一級緩存(32KB用于指令,另32KB用于數據),而且在主闆上還集成了以系統總線頻率同步運行的三級緩存,其容量大小從512KB到2MB之間。1999年6月23日,AMD公司推出了具有重大戰略意義的K7微處理器,并将其正式命名為Athlon。K7有兩種規格的産品:第一種采用0.25微米工藝制造,使用K7核心,工作電壓為1.6V(其緩存以主頻速度的一半運行);第二種采用0.18微米工藝制造,使用K75核心;工作電壓有1.7V和1.8V兩種。上述兩種類型的K7微處理器内部都集成了2130萬個晶體管,外頻均為200MHz。

Athlon包含128KB的L1 Cache(PⅡ/PⅢ隻有32KB);512KB~1MB L2 Cache的片外緩存。同時,它還采用了全新的宏處理結構,擁有三個并行的x86指令譯碼器,可以動态推測時序,亂序執行;K7擁有一個強勁的浮點處理單元,在3DNOW!指令的幫助下會有更進一步的3D和多媒體處理能力,這個先進的FPU使K7擁有超越其他x86微處理器2倍的性能!另外,K7采用了一種類似于Slot 1的全新的Slot A架構,從物理結構上兩者可以互換,但後者的電器性能和前者完全不兼容。在總線方面,使用的是Digital公司的Alpha系統總線協議EV6,外頻達200MHz;Athlon是AMD第一個具有SMP(對稱多微處理器技術)能力的桌面CPU,即使用者可以用Athlon構建雙微處理器甚至4微處理器系統!AMD公司在2000年6月份連續推出了新款的Thunderbird(雷鳥)、Duron(毒龍)微處理器,再次向英特爾Coppermine(銅礦)核心的微處理器發出了強有力的挑戰。

Thunderbird(雷鳥)

Thunderbird是AMD面向高端的Athlon系列延續産品,采用0.18微米的制造工藝,共有Slot A和Socket A兩種不同的架構,但它們在設計上大緻相同:均内置128KB的一級緩存和256KB的二級緩存,其二級緩存與CPU主頻速度同步運行;工作電壓為1.70V~1.75V,相應的功耗也比老的Athlon要小;集成3700萬個晶體管,核心面積達到120平方毫米。

另外,Thunderbird微處理器支持200MHz系統總線頻率,提供巨大的帶寬,且支持Alpha EV6總線協議,具有多重并行x86指令解碼器。

Duron(毒龍)

Duron微處理器是AMD首款基于Athlon核心改進的低端微處理器,它原來的研發代号稱為“Spitfire”。Duron外頻也是200MHz,内置128KB的一級緩存和64KB的全速二級緩存,它的工作電壓為1.5V,因而功耗要較Thunderbird小。而且它核心面積是100平方毫米,内部集成的晶體管數量為2500萬個,比K7核心的Athlon多300萬個。這些特點符合了AMD面對低端市場的策略,即低成本低功耗而又高性能。在浮點性能上,基于K7體系的Duron明顯優于采用P6核心設計的Intel系列微處理器,它具有三個全流水亂序執行單元,一個用于加/減運算,一個用于複合指令還有一個是浮點存儲單元。

其他微處理器發展

1975年,IBM公司生産了幾款基于RISC設計的處理器。其中801就是RISC之父John Cocke的傑作。最終15年後設計出Power架構系列産品,若幹年後更出出現一個影響深遠的RISC結構的芯片系列ARM

這是八十年代後,RISC架構被工業界認可後發展起的一種,HP的HPPA-RISC

1975年,摩托羅拉推出6800,該款處理器擁有78條指令集。摩托羅拉很多款單片裝處理器和微處理器的設計思想都來源于6800,即使曾經很流行功能強大的6809也是繼承了6800血統。1985年,摩托羅拉推出MC68010和已經命名為88000的32位RISC處理器系列。但1990年由于要全力研制PowerPC而被迫停産。

Z-80是由從Intel離走的Frederico Faggin設計的8位微處理器,被認為是8080的增強版,------是也是當年很牛的一款單片機,比後來風光無限的51系列更早進入中國,八十年代初學校都是以Z80為基礎教學,那種需要用電視作顯示器的單闆電腦就是用的這種芯片。

不過最先推出的單芯片16位處理器當數TI TMS 9900。雖然出道後勢頭強勁,但TI為了發展DSP業務,不得不在1982年縮小9900的産量

半導體行業另一巨頭,美國國家半導體公司,就是後來收購了設計X86系列處理器的Cyrix公司的,這是1983年由國家半導體(National Semiconductor)推出NS32032,也是一款RISC處理器,但是可惜的是RISC架構的處理器在個人電腦應用中隻有POWERPC芯片的市場還算比較成功,其它的都可以說很失敗,不過在另一領域:嵌入式應用中,RISC架構的處理器确是風光無限。

1981年,由斯坦福大學和部分研究者研制出MIPS。處理器利用了深度流水線技術。它通過簡化指令的操作周期,解決了流水線的瓶頸-聯鎖問題,促成RISC思想的重要轉變。

1982年,由美國伯克利大學研制的RISC-I,隻有32條指令,并且具有流水線操作和使用寄存器窗口,性能比同時代單芯片設計都優越

ARM是一家芯片設計公司,自己不生産芯片,而是通過授權生産來發展ARM系列處理器。ARM公司在1990年11月英國劍橋的一個谷倉裡成立,最初隻有12人,經過11年多的發展,今日的ARM公司已經擁有700多名員工,其中60%以上都從事研發工作,ARM公司是一家既不生産芯片(fabless)也不銷售芯片(chipless)的公司,它通過出售芯片技術授權,建立起新型的微處理器設計、生産和銷售商業模式。更重要的是,這種商業模式取得極大的成功,采用ARM技術IP核的微處理器遍及各類電子産品:汽車、消費電子、成像、工業控制、海量存儲、網絡、安保和無線等市場,ARM技術幾乎無處不在。ARM将其技術授權給世界上許多著名的半導體、軟件和OEM廠商,每個廠商得到的都是一套獨一無二的ARM相關技術及服務。利用這種合夥關系,ARM很快成為許多全球性RISC标準的締造者。總共有30家半導體公司與ARM簽訂了硬件技術使用許可協議,其中包括Intel、IBM、LG半導體、NEC、SONY、菲利浦和國民半導體這樣的大公司。至于軟件系統的合夥人,則包括微軟、升陽和MRI等一系列知名公司。

中國研發

2004年2月18日,由清華大學自主研發的32位微處理器THUMP芯片終于領到了由國家教育部頒發的“身份證”:典型工作頻率400MHz,功耗1.17mW/MHz,芯片顆粒40片,最高工作頻率可達500MHz,是目前國内工作頻率最高的微處理器。“這标志着我國在自主研發CPU芯片領域邁開了實質性的一大步。”教育部對THUMP的誕生給予了較高評價。

在龍芯1号、龍芯2号的基礎上,中國正在自主研發新一代的龍芯3号。

龍芯3A的工作頻率為900MHz~1GHz,功耗約15W,頻率為1GHz時雙精度浮點運算速度峰值達到每秒160億次,單精度浮點運算速度峰值每秒320億次。龍芯3A采用意法半導體公司(STMicro)65納米CMOS工藝生産,晶體管數目達4.25億個,芯片采用BGA封裝,引腳的數目為1121個,功耗小于15瓦。龍芯3A集成了四個64位超标量處理器核、4MB的二級Cache、兩個DDR2/3内存控制器、兩個高性能HyperTransport控制器、一個PCI/PCIX控制器以及LPC、SPI、UART、GPIO等低速I/O控制器。龍芯3A的指令系統與MIPS64兼容并通過指令擴展支持X86二進制翻譯。龍芯3号在包括服務器、高性能計算機、低能耗數據中心、個人高性能計算機、高端桌面應用、高吞吐計算應用、工業控制、數字信号處理、高端嵌入式應用等産品中具有廣闊的市場應用前景。

相關詞條

相關搜索

其它詞條