频道直达 - 专题 - 新闻 - 技巧 - 组网 - 开发 - 安全 - web编程 - 图像 - 操作系统 - 数据库 - 教育 - 旅游 - 健康 - 时尚 - 驱动 - 软件 - 游戏 - 多媒体 - ERP - 讨论组

AMD旗舰级原生四核Phenom 9900评测

来源:中关村在线 作者: 出处:巧巧读书 2007-12-26 进入讨论组
上一页 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 下一页 

●Phenom带来了什么(1)

  本次送测的K10架构CPU——AMD Phenom64 X4 9900是目前AMD方面最为高端的桌面级原生四核处理器,其频率为200MHzx13=2.6GHz,每个核心独立管理128KB的L1缓存和512KB的L2缓存,此外,四核心共享2MB容量的L3缓存。

Phenom当然不可能是K8的L3升级版,那么Phenom究竟为我们带来了怎样的新技术和新理念,对我们又有怎样的用处呢?下面我们将详细介绍Phenom的核心改进内容。

 ○更先进的架构

  Phenom是基于AMD研发的K10架构的原生多核心微型处理器,Phonem处理器采用65nm工艺,使用先进的11层应变硅通道技术,而之前的K8核心仅仅采用9层设计。或许大家对这样的技术参数并没有太大的概念,那用一个很简单的对比就可以了解这样的技术设计的领先意义——Intel Core2 Duo仅采用8层应变硅通道技术。四核心的Phonem处理器搭载2MB的L3缓存,晶体管数量高达4.63亿个,众所周知的是AMD的内存控制器是内置的,与内存控制器外置的传统南北桥平台相比,内存与CPU之间的数据交换会更有效率,表现在实际应用中就会带来更强的内存效能(随之而来的还有综合能耗的降低),这到目前为止依然是一项领先世界的技术,目前发布的Phenom依然支持DDR2内存(新的K10内存控制器能够提供DDR3内存模组,不过并未发布DDR3的版本,该版本将会在2008年后推出)。


AMD旗舰级原生四核Phenom 9900评测(图二)
K10核心架构写真

  同K8相比,K10拥有更多先进技术和优秀的改进,更强大的HT总线规格、加入CPU三级缓存、更优秀的CPU运算效率、更完备的指令集等等等等,在文章下面的内容中我们都将一一为大家详细说明。

 ○更强的HT总线规格

  HyperTransport是K8时代AMD提出的领先于时代的传输总线技术,K8的性能如此强劲,其中就有HyperTransport的功劳在内,第一代的HyperTransport 1.0具备1.0GHz的工作频率,单条数据总线数据传输速度达到6.4GB/s,AM2处理器在HyperTransport 1.0的帮助下得到了最大的性能发挥。

AMD旗舰级原生四核Phenom 9900评测(图三)
HyperTransport 3.0 工作方式示意

  于是K10的新御用平台为我们带来更新的HyperTransport 3.0规格,总线频率提升到了4GHz,数据传输带宽更是达到了史无前例的20.8GB/s(注:在高频率<2.6GHz>、高位宽<32bit>的方式下,HT3.0提供了41.6GB/s总线带宽<2600MHz×32bit×4/8>,在16bit位宽下则提供20.8GB/s带宽<2600MHz×16bit×4/8>),无论是工作频率还是传输带宽都远远超越了HyperTransport 2.0标准,有了HyperTransport 3.0,数据传输带宽将不会对K10的性能产生瓶颈,可以预料到,HyperTransport 3.0将成为K10发挥其性能的最佳助力。

 ○向下兼容的AM2+接口

  严格来说AM2的Socket 940针脚标准是Socket 939接口标准的升级版本,当AMD系列处理器全面升级,加入DDR2内存控制器之后开始启用,经过近2年的发展,AM2接口标准已经成为目前最为普及的AMD平台接口标准。Phenom出世,AM2接口标准显然已经到了更新换代的时候。AM2+接口标准也随着K10的出台而浮出水面。

AMD旗舰级原生四核Phenom 9900评测(图四)
依然采用同AM2同样的针脚布局

  应该也是考虑到AM2接口的普及率因素,Phenom处理器将采用向下兼容的AM2+接口标准,和AM2 Socket 940接口相比,增加了对HyperTransport 3.0的支持,提供了数据传输能力,而AM2+的御用芯片组AMD 7系列芯片组方面也全面采用PCI-E 2.0标准以保证数据通信带宽不会给系统造成瓶颈。总之,你可以把Phenom处理器装在AM2接口的主板上使用、也可以把K8 AM2的处理器装在AMD 7系列芯片组主板上使用,都没有问题,当然AM2接口的老主板无法享受HT3.0和PCI-E 2.0的豪华待遇。

●Phenom带来了什么(2)

 ○缓存的升级——加入L3缓存

  至今为止,AMD处理器的缓存容量都控制在比较低的范围,由于处理器内置了内存控制器,因此其对L2缓存的需求并不大,所以512KB的二级缓存容量对于AMD的K8和K10架构处理器来说已经完全绰绰有余。

  Phenom带来的另外一个革命性的技术就是CPU三级缓存的加入,在AMD的四核心处理器中,由一个核心单独管理自己对应的L1缓存和L2缓存,而AMD则另外设置了一个共享的2MB L3缓存来供四个核心分享使用。 其工作原理也并不复杂,同最初的单核心处理器的基本原理类似:核心首先向L1请求数据,如果数据不存在就再向L2缓存请求数据,而如果依旧没有依次向L3或者内存请求数据。


AMD旗舰级原生四核Phenom 9900评测(图五)
K10架构的缓存管理机制示意

  值得注意的是:如果L1缓存中数据已满,则数据只能存放到L2中,如果L2数据也存满,则会自动放到L3中。由于L3采用共享设计,当四个核心认为这项数据对自己有用,那么就直接从L3中调用这项数据。由于缓存的独占性,因此当已经有用的数据已经存在的话,就不会再去调用一次数据到缓存中。这种工作机制对于只启用单核心工作的时候优势是明显的:处理器就可以几乎由一颗核心来管理128KB的L1、512KB的L2以及2MB的L3。缓存的效率远比内存高,因此系统的综合效能就会有一定程度的提升。

 ○指令集的升级

  全新的Phonem处理器也加入了SSE128指令集,这项指令集的加入让Phonem处理器能够支持单循环内的128bit向量运算,这是K8架构处理器64bit运算带宽的两倍,这意味着Phonem处理器能够用单循环处理原本K8处理器双循环才能处理完毕的指令。

  由于128bit位宽的指令较之之前的64bit指令的字节数量要多,因此原始的指令存取带宽(每周期16字节指令预取)将不再适用,有鉴于此,AMD改良了原先的指令存取带宽,Phonem支持每周期32字节的指令预取(是K8的两倍),那Phonem处理器在处理SSE代码的时候就不会过度分割导致效率低下。

  存取和处理的效率获得了提高,相应的,L1数据缓存也得到了改进以令其更加适应128bit数据的处理和存取。这一系列的改进令K10架构处理器从数据处理的高度彻底领先于K8架构处理器。

 ○分支预测的改进

  熟悉处理器的读者应该都知道:分支预测部分的深度和宽度影响处理器的分支预测准确性,当提升分支预测器的宽度之后,其可以进行运算的能力更强,可以处理更加复杂的指令。正是如此,相较于K8,AMD在Phonem身上大大提升了分支目标缓存的容量,不仅如此,AMD通过对目前的编译器的分析,修正了分支预测逻辑,这使得其“命中率”大大提高,执行效率提升了,自然就使处理器在执行任务时更加高速。

  需要注意的是,Phonem的分支预测器采用了512入口,并且提供了间接分支预测机制,用简单的例子来说:当一个大型指令需要处理时,处理器的主分支预测单元会按照处理器的分配来执行,而间接分支预测单元则处理主分支预测单元未及处理的指令,同时也会修正一些错误指令。间接分支预测机制是一种效率和准确率都比较有保证的解决方案

AMD旗舰级原生四核Phenom 9900评测(图六)
羿龙的五大改进

 ○TDP的升级——全新技术带来更低的功耗

  新的Phonem四核处理器采用了新颖的功耗控制技术——分离供电,这是将内存控制器和CPU核心供电互相独立的技术,在内存控制器较忙碌而CPU核心比较空闲的时候,处理器核心将会降低工作电压,也就是说我们将看到这样的情况:内存控制器电压不变且非常忙碌(功耗最大),而CPU核心则电压下降且比较空闲(功耗极小),应用这样的技术,可以让Phonem的整体功耗降低到非常低的水平,再加上制造工艺采用65nm技术,这将令Phonem的功耗得到有效的控制。

  那么这样的系列改进会得到怎么样的好处呢?根据测试,Phonem处理器的功耗低于95W,而根据AMD方面的消息,更低功耗的Phonem版本也已经在推出计划中。对于能耗日益严重的硬件业界来说,这无疑是顺应时代的技术产物。

进入讨论组讨论。
上一页 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 下一页 
收藏此文】【 】【打印】【关闭
相关图文阅读
频道图文推荐
健 康 咨 询
时 尚 咨 询
巧巧读书宗旨
相关专题
讨论组问题推荐
站内各频道最新更新文档
站内最新制作专题
热门关键字导读
Photoshop教 程照片处理 照片制作 PS快捷键 抠图
计 算 机 故 障XP系统修复
艺 术 与 设 计设计 流媒体 设计欣赏 边框
计 算 机 安 全ARP
站内频道文章精选
巧巧电脑频道编辑信箱  告诉我们您想看的专题或文章