马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
x
1、X86处理器起源
CPU的溯源可以一直去到1971年。在那一年,当时还处在发展阶段的INTEL公司推出了世界上第一台微处理器4004。这不但是第一个用于计算器的4位微处理器,也是第一款个人有能力买得起的电脑处理器!4004含有2300个晶体管,功能相当有限,而且速度还很慢,属于4位处理器,被当时的蓝色巨人IBM以及大部分商业用户不屑一顾,但是它毕竟是划时代的产品,从此以后,INTEL便与微处理器结下了不解之缘。在4004之后,INTEL相继开发了8008,8080,8085这些都属于8位处理器。可以这么说,CPU的历史发展历程其实也就是INTEL公司X86系列CPU的发展历程,我们就通过它来展开我们的“CPU历史之旅”。
1978年,Intel公司再次领导潮流,首次生产出16位的微处理器,并命名为i8086,同时还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的指令集,但在i8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算指令。由于这些指令集应用于i8086和i8087,所以人们也这些指令集统一称之为X86指令集。虽然以后Intel又陆续生产出第二代、第三代等更先进和更快的新型CPU,但都仍然兼容原来的X86指令,而且Intel在后续CPU的命名上沿用了原先的X86序列,直到后来因商标注册问题,才放弃了继续用阿拉伯数字命名。至于在后来发展壮大的其他公司,例如AMD和Cyrix等,在486以前(包括486)的CPU都是按Intel的命名方式为自己的X86系列CPU命名,但到了586时代,市场竞争越来越厉害了,由于商标注册问题,它们已经无法继续使用与Intel的X86系列相同或相似的命名,只好另外为自己的586、686兼容CPU命名了。
1979年,INTEL公司推出了8088芯片,它仍旧是属于16位微处理器,内含29000个晶体管,时钟频率为4.77MHz,地址总线为20位,可使用1MB内存。8088内部数据总线都是16位,外部数据总线是8位,而它的兄弟8086是16位。1981年8088芯片首次用于IBM PC机中,开创了全新的微机时代。也正是从8088开始,PC机(个人电脑)的概念开始在全世界范围内发展起来。
在8086基础上还出过一款80186,是intel针对工业控制/通信等嵌入式市场,于1980年推出的8086处理器的扩展产品,除8086内核,另外包括了中断控制器、定时器、DMA、I/O、UART、片选电路等外设。。
1982年,许多年轻的读者尚在襁褓之中的时候,INTE已经推出了划时代的最新产品枣80286芯片,该芯片比8006和8088都有了飞跃的发展,虽然它仍旧是16位结构,但是在CPU的内部含有13.4万个晶体管,时钟频率由最初的6MHz逐步提高到20MHz。其内部和外部数据总线皆为16位,地址总线24位,可寻址16MB内存。从80286开始,CPU的工作方式也演变出两种来:实模式和保护模式。
2、Intel80286处理器
1985年INTEL推出了80386芯片,它是80X86系列中的第一种32位微处理器,而且制造工艺也有了很大的进步,与80286相比,80386内部内含27.5万个晶体管,时钟频率为12.5MHz,后提高到20MHz,25MHz,33MHz。80386的内部和外部数据总线都是32位,地址总线也是32位,可寻址高达4GB内存。它除具有实模式和保护模式外,还增加了一种叫虚拟86的工作方式,可以通过同时模拟多个8086处理器来提供多任务能力。除了标准的80386芯片,也就是我们以前经常说的80386DX外,出于不同的市场和应用考虑,INTEL又陆续推出了一些其它类型的80386芯片:80386SX、80386SL、80386DL等。1988年推出的80386SX是市场定位在80286和80386DX之间的一种芯片,其与80386DX的不同在于外部数据总线和地址总线皆与80286相同,分别是16位和24位(即寻址能力为16MB)。
1990年推出的80386SL和80386 DL都是低功耗、节能型芯片,主要用于便携机和节能型台式机。80386 SL与80386 DL的不同在于前者是基于80386SX的,后者是基于80386DX的,但两者皆增加了一种新的工作方式:系统管理方式。当进入系统管理方式后,CPU就自动降低运行速度、控制显示屏和硬盘等其它部件暂停工作,甚至停止运行,进入“休眠”状态,以达到节能目的。1989年,我们大家耳熟能详的80486芯片由INTEL推出,这种芯片的伟大之处就在于它实破了100万个晶体管的界限,集成了120万个晶体管。80486的时钟频率从25MHz逐步提高到33MHz、50MHz。80486是将80386和数学协处理器80387以及一个8KB的高速缓存集成在一个芯片内,并且在80X86系列中首次采用了RISC(精简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线方式,大大提高了与内存的数据交换速度。由于这些改进,80486的性能比带有80387数学协处理器的80386DX提高了4倍。80486和80386一样,也陆续出现了几种类型。上面介绍的最初类型是80486DX。1990年推出了80486SX,它是486类型中的一种低价格机型,其与80486DX的区别在于它没有数学协处理器。80486 DX2由系用了时钟倍频技术,也就是说芯片内部的运行速度是外部总线运行速度的两倍,即芯片内部以2倍于系统时钟的速度运行,但仍以原有时钟速度与外界通讯。80486 DX2的内部时钟频率主要有40MHz、50MHz、66MHz等。80486 DX4也是采用了时钟倍频技术的芯片,它允许其内部单元以2倍或3倍于外部总线的速度运行。为了支持这种提高了的内部工作频率,它的片内高速缓存扩大到16KB。80486 DX4的时钟频率为100MHz,其运行速度比66MHz的80486 DX2快40%。80486也有SL增强类型,其具有系统管理方式,用于便携机或节能型台式机。
3、Pentium的来历
在286、386、486这些产品深入人心后,1992年10月20日,在纽约第十届PC用户大会上,葛洛夫正式宣布Intel第五代处理器被命名Pentium,而不是586,出乎许多人预料。
事实上,Intel公司对此更名"蓄谋已久"。在此之前,由于386、486系列产品性能出众,AMD与Cyrix生产的处理器也以这些数字命名,INTEL虽大为不满却又无可奈何,因为按照法律,数字是不能用作商标名称,无法注册。"偏执狂"葛洛夫在一次记者招待会上说:"如果要命名586,就请从我身上跨过去"--充分显示了Intel管理层重新制定品牌战略的决心。
一场极其广泛的命名活动拉开了帷幕。从公司员工脑海中的灵感火花到海外友人集思广益,一共征集到3300多个名称。其中甚至有586NOT、iCUCyrix等十分有趣滑稽的名字。最后敲定的三个候选名称是InteLigence、RADAR1和Pentium.据说当时InteLigence的呼声颇高,但后来公司高层对它们的最终投票却使得Pentium脱颖而出。
为什么叫这样一个名字?葛洛夫解释说:它是一个来自古典语的商标,PENT在希腊文中表示"5",-ium看上去是某化学元素的词尾,用在这里可以表示处理器的强大处理能力和高速性能。
值得注意的是在PentimuPro的一个封装中除Pentimu Pro芯片外还包括有一个256KB的二级缓存芯片,两个芯片之间用高频宽的内部通讯总线互连,处理器与高速缓存的连接线路也被安置在该封装中,这样就使高速缓存能更容易地运行在更高的频率上。奔腾 Pro 200MHZCPU的L2 CACHE就是运行在200MHZ,也就是工作在与处理器相同的频率上。这样的设计领奔腾 Pro达到了最高的性能。
而Pentimu Pro最引人注目的地方是它具有一项称为“动态执行”的创新技术,这是继奔腾在超标量体系结构上实现实破之后的又一次飞跃。Pentimu Pro系列的工作频率是150/166/180/200,一级缓存都是16KB,而前三者都有256KB的二级缓存,至于频率为200的CPU还分为三种版本,不同就在于他们的内置的缓存分别是256KB,512KB,1MB。不过由于当时缓存技术还没有成熟,加上当时缓存芯片还非常昂贵,因此尽管Pentimu Pro性能不错,但远没有达到抛离对手的程度,加上价格十分昂贵,一次PentimuPro实际上出售的数目非常至少,市场生命也非常的短,Pentimu Pro可以说是Intel第一个失败的产品。
4、辉煌的开始——奔腾 MMX:
INTEL吸取了奔腾 Pro的教训,在1996年底推出了奔腾系列的改进版本,厂家代号P55C,也就是我们平常所说的奔腾 MMX(多能奔腾)。这款处理器并没有集成当时卖力不讨好的二级缓存,而是独辟蹊径,采用MMX技术去增强性能。
MMX技术是INTEL最新发明的一项多媒体增强指令集技术,它的英文全称可以翻译“多媒体扩展指令集”。MMX是Intel公司在1996年为增强奔腾 CPU在音像、图形和通信应用方面而采取的新技术,为CPU增加了57条MMX指令,除了指令集中增加MMX指令外,还将CPU芯片内的L1缓存由原来的16KB增加到32KB(16K指命+16K数据),因此MMX CPU比普通CPU在运行含有MMX指令的程序时,处理多媒体的能力上提高了60%左右。MMX技术不但是一个创新,而且还开创了CPU开发的新纪元,后来的SSE,3DNOW!等指令集也是从MMX发展演变过来的。
在Intel推出奔腾 MMX的几个月后,AM也推出了自己研制的新产品K6。K6系列CPU一共有五种频率,分别是:166/200/ 233/266/300,五种型号都采用了66外频,但是后来推出的233/266/300已经可以通过升级主板的BIOS 而支持100外频,所以CPU的性能得到了一个飞跃。特别值得一提的是他们的一级缓存都提高到了64KB,比MMX足足多了一倍,因此它的商业性能甚至还优于奔腾 MMX,但由于缺少了多媒体扩展指令集这道杀手锏,K6在包括游戏在内的多媒体性能要逊于奔腾 MMX。
5、优势的确立——奔腾 Ⅱ:
Intel奔腾Ⅱ处理器 :
在接口技术方面,为了击跨INTEL的竞争对手,以及获得更加大的内部总线带宽,奔腾Ⅱ首次采用了最新的solt1接口标准,它不再用陶瓷封装,而是采用了一块带金属外壳的印刷电路板,该印刷电路板不但集成了处理器部件,而且还包括32KB的一级缓存。如要将奔腾Ⅱ处理器与单边插接卡(也称SEC卡)相连,只需将该印刷电路板(PCB)直接卡在SEC卡上。SEC卡的塑料封装外壳称为单边插接卡盒,也称SEC(Single-edgecontactCartridge)卡盒,其上带有奔腾Ⅱ的标志和奔腾Ⅱ印模的彩色图像。在SEC卡盒中,处理器封装与L2高速缓存和TagRAM均被接在一个底座(即SEC卡)上,而该底座的一边(容纳处理器核心的那一边)安装有一个铝制散热片,另一边则用黑塑料封起来。奔腾ⅡCPU内部集合了32KB片内L1高速缓存(16K指令/16K数据);57条MMX指令;8个64位的MMX寄存器。750万个晶体管组成的核心部分,是以203平方毫米的工艺制造出来的。
处理器被固定到一个很小的印刷电路板(PCB)上,对双向的SMP有很好的支持。至于L2高速缓存则有,512K,属于四路级联片外同步突发式SRAM高速缓存。这些高速缓存的运行速度相当于核心处理器速度的一半(对于一个266MHz的CPU来说,即为133MHz)。奔腾Ⅱ的这种SEC卡设计是插到Slot1(尺寸大约相当于一个ISA插槽那么大)中。所有的Slot1主板都有一个由两个塑料支架组成的固定机构。一个SEC卡可以从两个塑料支架之间滑入Slot1中。将该SEC卡插入到位后,就可以将一个散热槽附着到其铝制散热片上。266MHz的奔腾Ⅱ运行起来只比200MHz的奔腾Pro稍热一些(其功率分别为38.2瓦和37.9瓦),但是由于SEC卡的尺寸较大,奔腾Ⅱ的散热槽几乎相当于Socket7或Socket8处理器所用的散热槽的两倍那么大。
除了用于普通用途的奔腾Ⅱ之外,Intel还推出了用于服务器和高端工作站的Xeon系列处理器采用了Slot 2插口技术,32KB 一级高速缓存,512KB及1MB的二级高速缓存,双重独立总线结构,100MHz系统总线,支持多达8个CPU。
6、世纪末的辉煌——奔腾III:
在99年初,Intel发布了第三代的奔腾处理器——奔腾III,第一批的奔腾III 处理器采用了Katmai内核,主频有450和500Mhz两种,这个内核最大的特点是更新了名为SSE的多媒体指令集,这个指令集在MMX的基础上添加了70条新指令,以增强三维和浮点应用,并且可以兼容以前的所有MMX程序。
不过平心而论,Katmai内核的奔腾III除了上述的SSE指令集以外,吸引人的地方并不多,它仍然基本保留了奔腾II的架构,采用0.25微米工艺,100Mhz的外频,Slot1的架构,512KB的二级缓存(以CPU的半速运行)因而性能提高的幅度并不大。不过在奔腾III刚上市时却掀起了很大的热潮,曾经有人以上万元的高价去买第一批的奔腾III。
可以大幅提升,从500Mhz开始,一直到1.13Ghz,还有就是超频性能大幅提高,幅度可以达到50%以上。此外它的二级缓存也改为和CPU主频同步,但容量缩小为256KB。
除了制程带来的改进以外,部分Coppermine 奔腾III还具备了133Mhz的总线频率和Socket370的插座,为了区分它们,Intel在133Mhz总线的奔腾III型号后面加了个“B”, Socket370插座后面加了个“E”,例如频率为550Mhz,外频为133Mhz的Socket370 奔腾III就被称为550EB。
看到Coppermine核心的奔腾III大受欢迎,Intel开始着手把Celeron处理器也转用了这个核心,在2000年中,推出了Coppermine128核心的Celeron处理器,俗称Celeron2,由于转用了0.18的工艺,Celeron的超频性能又得到了一次飞跃,超频幅度可以达到100%。
7、AMD的绝地反击——Athlon
在AMD公司方面,刚开始时为了对抗奔腾III,曾经推出了K6-3处理器。K6-3处理器是三层高速缓存(TriLevel)结构设计,内建有64K的第一级高速缓存(Level 1)及256K的第二层高速缓存(Level 2),主板上则配置第三级高速缓存(Level 3)。K6-3处理器还支持增强型的3D Now!指令集。由于成本上和成品率方面的问题,K6-3处理器在台式机市场上并不是很成功,因此它逐渐从台式机市场消失,转进笔记本市场。
真正让AMD扬眉吐气的是原来代号K7的Athlon处理器。Athlon具备超标量、超管线、多流水线的Risc核心(3Way SuperScalar Risc core),采用0.25微米工艺,集成2,200万个晶体管,Athlon包含了三个解码器,三个整数执行单元(IEU),三个地址生成单元(AGU),三个多媒体单元(就是浮点运算单元),Athlon可以在同一个时钟周期同时执行三条浮点指令,每个浮点单元都是一个完全的管道。K7包含3个解码器,由解码器将解码后的macroOPS指令(K7把X86指令解码成macroOPS指令,把长短不一的X86指令转换成长短一致的macroOPS指令,可以充分发挥RISC核心的威力)送给指令控制单元,指令控制单元能同时控制(保存)72条指令。再把指令送给整数单元或多媒体单元。整数单元可以同时调度18条指令。每个整数单元都是一个独立的管道,调度单元可以对指令进行分支预测,可以乱序执行。K7的多媒体单元(也叫浮点单元)有可以重命名的堆栈寄存器,浮点调度单元同时可以调度36条指令,浮点寄存器可以保存88条指令。在三个浮点单元中,有一个加法器,一个乘法器,这两个单元可以执行MMX指令和3DNow指令。还有一个浮点单元负责数据的装载和保存。由于K7强大的浮点单元,使AMD处理器在浮点上首次超过了Intel当时的处理器。
Athlon内建128KB全速高速缓存(L1 Cache),芯片外部则是1/2时频率、512KB容量的二级高速缓存(L2 Cache),最多可支持到8MB的L2Cache,大的缓存可进一步提高服务器系统所需要的庞大数据吞吐量。
Athlon的封装和外观跟PentiumⅡ相似,但Athlon采用的是Slot A接口规格。Slot A接口源于Alpha EV6总线,时钟频率高达200MHz,使峰值带宽达到1.6GB/S,在内存总线上仍然兼容传统的100MHz总线,现这样就保护了用户的投资,也降低了成本。后来还采用性能更高的DDR SDRAM,这和Intel力推的800MHzRAMBUS的数据吞吐量差不多。EV6总线最高可以支持到400MHz,可以完善的支持多处理器。所以具有天生的优势,要知道Slot1只支持双处理器而SlotA可支持4处理器。SlotA外观看起来跟传统的Slot1插槽很像,就像Slot1插槽倒转180度一样,但两者在电气规格、总线协议是完全不兼容的。Slot 1/Socket370的CPU,是无法安装到Slot A插槽的Athlon主板上,反之亦然。
8、踏入新世纪的CPU
进入新世纪以来,CPU进入了更高速发展的时代,以往可望而不可及的1Ghz大关被轻松突破了,在市场分布方面,仍然是Intel跟AMD公司在两雄争霸,它们分别推出了Pentium4、Tualatin核心Pentium Ⅱ和Celeron、Tunderbird核心Athlon、AthlonXP和Duron等处理器,竞争日益激烈。
①在Intel方面,在上个世纪末的2000年11月,Intel发布了旗下第四代的Pentium处理器,也就是我们天天都能接触到的Pentium 4。Pentium 4没有沿用PIII的架构,而是采用了全新的设计,包括等效于的400MHz前端总线(100 x 4), SSE2指令集,256K-512KB的二级缓存,全新的超管线技术及NetBurst架构,起步频率为1.3GHz。
第一个Pentium4核心为Willamette,全新的Socket 423插座,集成256KB的二级缓存,支持更为强大的SSE2指令集,多达20级的超标量流水线,搭配i850/i845系列芯片组,随后Intel陆续推出了1.4GHz-2.0GHz的Willamette P4处理器,而后期的P4处理器均转到了针角更多的Socket 478插座。
和奔腾III一样,第一个Pentium4核心并不受到太多的好评,主要原因是新的CPU架构还不能受到程序软件的充分支持,因此Pentium4经常大幅落后于同频的Athlon,甚至还如Intel自己的奔腾III。但在一年以后,Intel发布了第二个Pentium4核心,代号为Northwood,改用了更为精细的0.13微米制程,集成了更大的512KB二级缓存,性能有了大幅的提高,加上Intel孜孜不倦的推广和主板芯片厂家的支持,目前Pentium4已经成为最受欢迎的中高端处理器。
在低端CPU方面,Intel发布了第三代的Celeron核心,代号为Tualatin,这个核心也转用了0.13微米的工艺,与此同时二级缓存的容量提高到256KB,外频也提高到100Mhz,目前Tualatin Celeron的主频有1.0、1.1、1.2、1.3Ghz等型号。Intel也推出了Tualatin核心的奔腾III,集成了更大的512KB二级缓存,但它们只应用于服务器和笔记本电脑市场,在台式机市场很少能看到。
②在AMD方面,在2000年中发布了第二个Athlon核心——Tunderbird,这个核心的Athlon有以下的改进,首先是制造工艺改进为0.18微米,其次是安装界面改为了SocketA,这是一种类似于Socket370,但针脚数为462的安装接口。最后是二级缓存改为256KB,但速度和CPU同步,与Coppermine核心的奔腾III一样。
Tunderbird核心的Athlon不但在性能上要稍微领先于奔腾III,而且其最高的主频也一直比奔腾III高,1Ghz频率的里程碑就是由这款CPU首先达到的。不过随着Pentium4的发布,Tunderbird开始在频率上落后于对手,为此,AMD又发布了第三个Athlon核心——Palomino,并且采用了新的频率标称制度,从此Athlon型号上的数字并不代表实际频率,而是根据一个公式换算相当于竞争对手(也就是Intel)产品性能的频率,名字也改为AthlonXP。例如AthlonXP1500+处理器实际频率并不是1.5Ghz,而是1.33GHz。最后,AthlonXP还兼容Intel的SSE指令集,在专门为SSE指令集优化的软件中也能充分发挥性能。
在低端CPU方面,AMD推出了Duron CPU,它的基本架构和Athlon一样,只是二级缓存只有64KB。Duron从发布开始,就能远远抛离同样主攻低端市场的Celeron,而且价格更低廉,一时间Duron成为低价DIY兼容机的第一选择,但Duron也有它致命的弱点,首先是继承了Athlon发热量大的特点,其次是它的核心非常脆弱,在安装CPU散热器时很容易损坏。
9、近几年的主流CPU 在非服务器端近几年来最流行的X86 CPU非英特尔酷睿系列莫属了,代表性的为酷睿i3,i5,i7。目前酷睿系列已发展到了第六代i7,前身为 Skylake,采用14nm工艺。限于篇幅,以下就不再介绍。
|