s1005t 2008-10-30 21:33
秒杀一切 Intel最新旗舰Core i7笑傲群U
[b][Intel新旗舰Nehalem驾到][/b]
两年前在台湾举行的Computex 2006上,我们看到了X6800的身影,Intel也随后宣布了其tick-tock计划,就是从这时候起,Core微架构和Core 2 Duo系列CPU开始崭露头角,直到去年年底我们又看到了Core架构的更新,Penryn的发布代表了“tick”的一步,而事实也证明了Penryn确实是在Conroe的基础上做到了降低功耗的同时提升性能,但Penryn的发布明显没有Conroe诞生时的那种举世瞩目的感觉了。
[img]http://hardware.mydrivers.com/img/20081016/S04062303.jpg[/img]
在tick之后接踵而至的是tock,Penryn对于Conroe而言更多是制造工艺的进步,而接下来的Nehalem完全是一个全新的微架构体系,同样使用最新的45nm工艺制造,对于Intel而言,全球玩家的眼球又再一次的集中到了他们身上。
Nehalem是Intel在即将发布的内置内存控制器的新CPU的研发代号,而发布时将使用Core i7的产品名称,这个架构的产品同样将使用在服务器平台上(Xeon),在未来的一两年内这个架构将会沿用到入门级CPU上,基于此结构的CPU将会内置内存控制器,支持三通道DDR3内存结构,也将重拾超线程技术,以及新的QPI总线。
[img]http://hardware.mydrivers.com/img/20081016/12264454.jpg[/img]
下面是我们对Nehalem特性的一些总结。
1. 基于Intel Core微架构
2. 2-8颗核心。
3. 内置三通道DDR3内存控制器。
4. 每颗核心独享256KB二级缓存。
5. 8 MB共享三级缓存。
6. SSE 4.2指令集(七条新指令)。
7. 超线程技术。
8. Turbo mode(自动超频)。
9. 微架构优化(支持64-bit模式的宏融合,提高环形数据流监测器性能,六个数据发射端口等等)
10. 提升预判单元性能,增加第二组分支照准缓存。
11. 第二组512路的TLB。
12. 对于非整的SSE指令提升性能。
13. 提升虚拟机性能(根据Intel官方数据显示,Nehalem相对65nm Core 2在双程虚拟潜伏上有60%的提升,而相对45nm Core 2产品提升了20%)
14. 新的QPI总线。
15. 新的能源管理单元。
16. 45nm制程,32nm制程产品随后上线,代号Westmere。
17. 新的1366针脚接口。
Nehalem相当于65nm产品有着如下几个最重要的新增功能。
1. SSE4.1指令集(47个新SSE指令)。
2. 深层休眠技术(C6级休眠,只在移动芯片上使用)。
3. 加强型Intel动态加速技术(只在移动芯片上使用)。
4. 快速Radix-16分频器和Super Shuffle engine,加强FPU性能
5. 加强型虚拟技术,虚拟机之间交互性能提升25%-75%。
[b][“内置”“三通道”内存控制器][/b]
接下来,让我们探讨一下新架构带来性能提升细节。
首先就是三通道内存控制器,这里有两个创新,一个是“三”通道,一个是“CPU内置”,在Nehalem,也就是Core i7上我们可以实现三根内存并行存取的规格,理论上而言,三通道的性能相比同频率双通道会提升50%的性能,当然,理论归理论,当年双通道替代单通道的时候也是号称性能翻番,但实际上的性能虽有提升,但不会有那么夸张。
[img]http://hardware.mydrivers.com/img/20081016/S12313664.jpg[/img]
于是,如果玩家想在Nehalem平台上实现最高性能,那就必须使用三根或者六根内存搭建最强的三通道内存系统,相对过去内存总容量总是呈现如2GB、4GB,今后的计算机将出现3GB、6GB等等内存规格。
在X58芯片的选择上广大玩家也应当注意,Intel的某些X58产品只有四根内存插槽,如代号“Smackover”的产品,如果玩家在四根插槽上全部插上内存,虽然总的容量提升了,但性能却下降了,如果插上了四根单条1GB的内存,系统会自动将前三根识别为三通道,但在内存区域的3GB到4GB之间的地址上,系统只会识别出单通道,计算机也是遵循木桶原理的,这最后的1GB会直接影响到整个内存系统的性能,所以选择Nehalem平台的玩家千万注意这个问题。
三通道模式下的内存系统,拥有192-bit的CPU-内存交互带宽(3 x 64bit),如果插上三根DDR3-1066内存,那么你就会得到25.58GB/s的最大理论传输值。但需要注意的是Nehalem CPU只内置了DDR3内存控制器,这也是Intel主推的一个内存更新换代的趋势。
而正是因为内置了DDR3内存控制器,Intel就必须在将CPU插槽更换为更多阵脚的1366插槽,所以对于玩家而言,Core i7与目前的主板产品是非兼容的,广大玩家必须同时更新主板和使用三根DDR3内存才能享受到Nehalem带来的最新性能体验,虽然初期的价格会相当高昂,但整个换代所带来的性能提升还是让人兴奋不已。
[b][三级缓存时代 更新的缓存设计][/b]
接下来我们看看缓存方面的改进。
Nehalem采用了每颗核心独享二级缓存,四颗核心共享三个缓存的策略,这点与对手AMD的产品方案比较类似,Core i7的每个核心拥有256KB的二级缓存,四颗核心共享8MB三级缓存,但不排除Intel在Xeon产品上增加缓存的可能性,而一级缓存则和前代产品一样,32KB指令缓存和32KB数据缓存。
对于Core 2 Duo产品而言,双核产品是两颗核心间共享二级缓存,而四核产品则是分为两颗核心为一单位共享二级缓存,从下面的图中大家就会看出来。
[img]http://hardware.mydrivers.com/img/20081016/S01005246.gif[/img]
[img]http://hardware.mydrivers.com/img/20081016/S01013064.gif[/img]
[b][Nehalem:站在巨人的肩膀上][/b]
在前文中我们提到过,Nehalem架构源自于Core 2 Duo,在后者的基础上加强了CPU内指令流的执行性能,接下来让我们详细看看在哪些细节上有增强。
追究起来,Core 2 Duo架构是基于Pentium M研发而来的,而Pentium M来源于Pentium 3,属于Intel第六代产品,而使用Netburst架构的Pentium 4是第七代产品,两代之间的架构完全不同,而Core 2和Core i7却与Pentium 4基本上没有任何联系,或许你已经察觉,新架构的根基居然来自上上代产品,而并非更新的上代产品,这也从一个侧面反映了Netburst Pentium 4的工作效率甚至不如更老架构的产品。
下图中列出了Nehalem微架构的族谱,从上一代产品中吸收了什么东西,增加了什么特性都一目了然,当然这不是一个完全全面的表格,但主要的内容都提及到了。
[img]http://hardware.mydrivers.com/img/20081016/S01022978.gif[/img]
为了更了解Nehalem微架构带来的性能提升,我们首先必须知道,程序是基于x86指令集写的,是不为CPU执行单元所能直接识别的,他们必须首先被解码为微指令才能被执行单元识别,这个CISC/RISC混合结构来自于Pentium Pro:CPU接收x86指令(CISC),但使用微指令(RISC)执行。
Core 2 Duo产品使用的Core微架构,引入了宏融合的概念,能将两个x86指令编译为一个微指令让CPU执行,因为减少了工作负荷,所以在提高性能的同时降低了CPU功耗,但这个特性只能在比较类指令和假定分支指令下才能使用,比如CMP or TEST plus a Jcc指令。
而Nehalem从两个方面增强了宏融合的性能,首先就是将能使用宏融合的指令数量增加了,其次就是Nehalem的宏融合能支持32-bit和64-bit两种模式,而Core 2 Duo只有在CPU工作在32-bit模式下时才能使用宏融合技术。
Core微架构里增加了一个回路流检测器,就是一个位于CPU预取单元和解码单元之间的18指令缓存,当CPU执行一个环形回路指令时(很多程序在这个位置会重复执行同一个环形回路指令数次),此时的CPU不需要再在一级缓存里提取数据,因为他们已经在这个18指令缓存里了,在这个时候CPU就可以关闭预取和分支预测单元,达到节能的效果。
[img]http://hardware.mydrivers.com/img/20081016/01034375.gif[/img]
在Nehalem微架构里,这个小小的缓存被移到了解码单元之后,而且并不是像Core 2 Duo那样是一个x86指令集,而是一个28微指令集。这一举措能改进CPU性能,因为当CPU执行一个回路时,在这个缓存里就能执行解码命令,也就省去了解码单元的工作环节,所以在Nehalem下,这里的解码单元也能关闭了,更高性能,更低电量。
Nehalem比前代产品多了一个指令发射端,总共有12个执行单元,所以相对前代产品,同一时间下能执行更多的指令,性能提升。
Nehalem微架构还增加了两个额外的缓冲器,第二个512路Translation Look-aside Buffer(TLB)和第二个Branch Target Buffer(BTB),这些缓冲器的增加对性能的提升有一定贡献。TLB缓冲器是一个供物理地址和虚拟地址交互的平台,尤其作用于虚拟内存线路,虚拟内存是指CPU将硬盘上的一部分空间模拟成内存,使计算机在内存不足的情况下也能保持运行,主要的原理就是将内存中的数据放置在硬盘上,腾出内存空间进行后续操作。
分支预取单元是一个猜测程序后续步骤并提前预取数据的单元,如果预取命中,CPU则会无损时间的继续执行工作,因为数据已经提前抵达缓存内,CPU不用等待数据从内存中读取。而Nehalem不仅允许更大容量的预取,而且增加了一个新的预取单元,相当幅度的提升性能。
[b][对漏电Say No,新电源管理机制][/b]
[img]http://hardware.mydrivers.com/img/20081016/S01050448.jpg[/img]
工作在CPU里的晶体管就类似于一个开关,在其控制下有着两种不同的状态:一是可导状态,也称为“饱和状态”,代表了“开启”的意思;另一种是非可导状态,又称“切断模式”,也就是“断开”的意思。虽然按照理论而言在晶体管处于非可导状态时不可能有任何的电流能通过,但实际上依然存在一小部分电流在流通,这就是所谓的“漏电”现象,数以亿计的晶体管所产生的漏电量是相当可观的,而漏掉的电也就是被浪费的资源,并且造成了无谓的热量,所以,如何减少漏电量也是近些年来CPU科学家们最深入研究的课题之一。
Nehalem在CPU内内置了一个电源控制单元,这个单元能减少“漏电现象”的发生,以及促生了另一个“Turbo Mode”的技术,关于这个技术我们稍后作介绍。于是,Core i7能独立控制每颗核心的电压和频率,也能为内存控制器、I/0单元和缓存独立控制电压,在以往的产品上是不能实现核心单独更改电压、频率的,而Core i7可以做到这一点,从而松弛有张的控制功耗与性能的比例。
[img]http://hardware.mydrivers.com/img/20081016/S01055307.jpg[/img]
这个控制单元还能关闭任何的CPU核心,也能将任何核心独立控制在C6等级的最节能电源模式下而其他核心则好不受影响,对于玩家而言,空载或者非满载情况下,完全全速运行全部核心确实有点浪费,而Core i7则能解决这个问题,更省电更智能。
[b][不省一枪一弹 随时随地全力开火][/b]
前文提到的CPU内置电源控制单元也能监测每颗核心的功耗,所以CPU就知道每颗核心到底耗用了多少电,也知道每颗核心发出的热量,这也就为Turbo Mode的出现提供了基础。
在Turbo Mode下,每颗处于活动状态下的核心可以独立的提升频率,Core i7虽然不是第一款拥有此技术的CPU,早在Pentium 4时代便有这个技术的应用了,但不同点在于以前产品上不能多颗核心同时提升,而必须在其他核心都处于空载状态时才能提升某颗核心的频率。
[img]http://hardware.mydrivers.com/img/20081016/S03141992.jpg[/img]
这个Turbo Mode实际就是一个闭合回路系统,CPU一直持续不断的在监测温度和能耗,所以CPU能自动提升频率直到达到最大TDP值,充分利用性能弹性空间,但这个超频数据的好坏还主要来自于玩家的散热系统,如果玩家的散热系统具备为130W热量进行散热的条件时,CPU就能自动调节频率来匹配散热系统的最大性能,所以如果玩家将原装散热器更换为更强的第三方散热器时,别忘了进入主板设置里输入新的散热器所能镇压的最大热量值,这样才能更有效的发挥Turbo Mode的实力。
虽然Turbo Mode技术的实现并不需要玩家关闭其他核心,但这个动态频率调节技术的基础还是在于整个CPU的功耗和热量上,减少一颗或几颗核心的运作将会提升这个超频核心的超频幅度,在某些对多线程不感冒的程序里可以达到更好的性能效果。
Turbo Mode是SpeedStep技术的一个扩展部分,所以在系统里将会被识别成一个SpeedStep特性,而且只会在CPU上才能使用此技术,内存控制器和缓存并不能受这个技术影响,而且这个技术也只会出现在Extreme Edition版的CPU上。
[b][同样重要的两个“新”特性][/b]
让我们再看看接下来的两个特性,HyperThreading和对“非对齐”SSE指令的优化。
[img]http://hardware.mydrivers.com/img/20081016/03373395.gif[/img]
HyperThreading超线程技术对于任何有点硬件常识的玩家肯定都不陌生,它能使系统将一颗屋里核心识别为两颗逻辑核心,对于Core i7而言,在任务管理器里就能看到八颗核心,这个技术的原理就在于,CPU在运作的时候,内部可能会存在相当部分的管线处于空闲状态,而调动起这部分的资源就变成了第二个虚拟逻辑核心,这个技术起始于Pentium 4,而这个技术也被称作为SMT技术,全称Simultaneous Multi-Threading同步多线程,但显然这个技术实现的“八核心”不可能与物理八核心的性能相提并论,同频下的物理八核心性能一定强过使用超线程技术的四核心,但这种免费的性能提升对于玩家而言也是十分超值的。
大家首先应该知道SSE指令分为两种,“对齐”的和“非对齐”的,“对齐式”SSE需要目标数据必须在16-byte(128bit)的地址边界之内,而“非对齐式”则不需要。
[img]http://hardware.mydrivers.com/img/20081016/S01062156.gif[/img]
这样说起来稍微模糊了一点,让我举个例子来说明一下,比如一个拥有双通道内存的系统,内存控制器将以128bit为单位对内存数据进行读取,所以内存数据也将会被分割为一个个以128bit为单位的块,所以根据理论,最理想的数据读取方案就是每次都读取一整个块的内容,这样的最大优点就在于只需要一次读写便能实现运算。
但在实际情况中,不可能出现这种完全理想的运行环境,很多情况下我们都需要从一个块的中间开始读取数据,在另一个块的中间结束,就因为数据被分割成两个部分,内存控制器不得不进行两次读取才能获得完整的数据。虽然“对齐式”指令能一次读取完整数据,相当幅度提高CPU工作效率,但同时这也对程序员的工作造成了相当大的困难,因为他们必须得事先了解内存数据的组织,而这个是相当复杂的工作,所以目前几乎所有的程序员都更多的使用“非对齐式”指令。
以往的Intel CPU产品都注重于对“对齐式”指令的优化,而“非对齐式”指令的运行速度慢一些,并且一般会被编译为多个微指令,换句话说就是对于程序员而言,“非对齐式”指令速度慢但更容易编译,而Nehalem CPU对于“非对齐式”指令的优化级别已经与“对齐式”指令一致,也就是说,两种SSE指令的运行速度已经没有差别,将相当幅度的提升CPU性能。
[b][什么是QPI][/b]
Intel目前在CPU与内存和I/O接口之间的连接总线为“Front Side Bus”,简称FSB,下代的总线结构已经在Nehalem上展示了出来,新总线结构拥有两条外部总线:一条用于CPU内置内存控制器与内存间的数据交换,一条用于CPU与I/O设备间的数据交换。这种新的总线结构被称为QuickPath Interconnect,简称QPI。
[img]http://hardware.mydrivers.com/img/20081016/S01073567.jpg[/img]
[img]http://hardware.mydrivers.com/img/20081016/S01075906.jpg[/img]
在图一和图二中我们向大家展示了两种总线结构,可以看到最大的不同来自于新CPU的内置内存控制器。
这种内置内存控制器的做法AMD在2003年推出第一款Athlon 64 CPU时就已经出现了,目前所有的AMD处理器都是内置内存控制器的,同时AMD的处理器还有叫HyperTransport的点对点传输技术,其作用是连接CPU与内存、I/O设备等,与FSB功能类似但结构完全不同。
从技术角度而言,QPI和HT技术都不能算是“总线”,所谓“总线”是指一系列的线路将多个设备连接在一起,而QPI和HT都是“点对点传输技术”,是只能在两个设备间传输数据的结构,不过为了方便大家理解,我们还是继续称其为“总线”。
与HT技术类似,QPI也在CPU和主板芯片组之间提供了两条独立的lane,允许CPU的数据传输(写入)和数据接收(读取)可以同时进行。而传统的FSB总线只有一条lane,写入读取都在同一线路上,不能同时进行。
说到芯片组,Intel放出了单芯片设计的主板,因为内存控制器内置到CPU差不多就意味着整个北桥都转移到了CPU内部,主板上只需要设计南桥芯片即可。
[img]http://hardware.mydrivers.com/img/20081016/S01084060.jpg[/img]
[b][QPI工作原理][/b]
OK,来看看QPI是如何工作的。
每条lane每次传输20bit的数据,16bit是数据内容,剩下的4bit是CRC循环冗余检测,用于接收器来检测数据十分完整。
第一版本的QPI将运行在3.2GHz的频率上,因为使用DDR技术,可以实现数据双向传送,所以其有效频率为6.4GHz,因为每次传输的数据为16bit,所以我们得到的最大理论传输速度为6.4GHz x 16bit / 8,即每条链路为12.8GB/s,你可能看到某些人说QPI最大理论传输率为25.6GB/s,而我不同意这样的算法,因为他们的算法没有考虑到两条独立的lane上,就好比我们不能因为高速公路双向限速为120公里就说整条高速限速是240公里一样,这种算法是没有道理的。
与FSB相比,QPI每时钟的单位传输量甚至还要小些,但QPI的频率相当高,目前最快的FSB为1600MHz,而因为FSB基于QDR技术,实际上CPU外频仅为400MHz,QPI技术的3.2GHz速度是其8倍,也就意味着对于QPI而言,两条lane各自有12.8GB/s的带宽,而1600MHz的FSB总线带宽还得由读取写入共同使用,并且读取和写入不能同时进行。况且FSB既要负责内存和I/O设备与CPU间的数据传输,而QPI只需要负责I/O设备,所以QPI相对FSB而言,就是一条车更少但马路更宽的数据通道。
写到这里,自然要和AMD的HT技术作对比,QPI的速度优势在这里依然继续,根据AMD资料,HT技术的最大传输率为10.4GB/s,而目前实际的Phenom处理器最高也只达到了7.2GB/s,所以Intel i7处理器在外部总线上有78%的速度优势,而AMD的其他产品就更不用多说,Athlon X2仅仅4GB/s的传输率更远远落后QPI达到220%。
接下来让我们聊聊QPI的电气传输性能,每bit数据的传输都使用不同的pair,所以每bit数据的传输占用两条wire,QPI会使用84条wire来传输数据,基本上是使用FSB技术的处理器的一半(150条wire),所以QPI相对FSB的第三个优势就是使用更少的内部线路(第一个优势是独立的内存和I/O设备lane,第二个优势是同时读写和大带宽)
[img]http://hardware.mydrivers.com/img/20081016/S01094562.jpg[/img]
QPI使用分层式架构,与网络架构类似,分四层,分别为:物理层、连接层、路由层、协议层。
QPI提供了三种电源模式,L0、L0s、L1。L0是全速模式,L0s是关闭非必须的wire来实现节电的模式,L1是完全关闭模式,最大限度节能。当然L1模式时需要更长的唤醒时间。
[img]http://hardware.mydrivers.com/img/20081016/S01120381.jpg[/img]
在前文中我们提到了QPI每次传输的数据为20bit,QPI还有一项技术能将这20bit数据分为5bit一个包,这种分装能提升数据的传输的可靠性,对于服务器尤其有用的技术,但在桌面处理器上我们也马上能看到。
当我们启用了这项技术时,当接收器感知到数据传输设备发生物理损坏时,它能关闭损坏的部分lane,使其他正常工作的lane继续工作,虽然降低了传输率,但保证了系统的稳定性不至于崩溃。
[b][Core i7本尊现身][/b]
先让我们看看Nehalem Core i7家族的成员各自的规格。
[img]http://hardware.mydrivers.com/img/20081016/01132456.jpg[/img]
[img]http://hardware.mydrivers.com/img/20081016/S01164042.jpg[/img]
对比QX9770,我们可以看到,Core i7 940的面积大上了不少,以前LGA775的散热器已经不能兼容Nehalem平台了。
[img]http://hardware.mydrivers.com/img/20081016/S01153748.jpg[/img]
同为四核心,从针脚和陶瓷电容数量来看,Core i7 940比QX9770的阵势要豪华太多了,看来集成内存控制器对于Nehalem而言确实增加了不少晶体管数量。
[img]http://hardware.mydrivers.com/img/20081016/S01184310.jpg[/img]
ASUS P6T-Dulexe主板CPU插槽特写,可以看得出与以往的CPU插槽明显不同,大了很多。呈现两个L型组成的一个方形针脚阵型。
[b][测试平台及方法介绍][/b]
[img]http://hardware.mydrivers.com/img/20081016/01252273.jpg[/img]
[img]http://hardware.mydrivers.com/img/20081016/S01593353.jpg[/img]
[img]http://hardware.mydrivers.com/img/20081016/02013134.jpg[/img]
对比平台采用X48+QX9770的上代最强组合,从他们在全球各大媒体测试中的成绩可以看出,他们基本上就代表了当今桌面级计算机的最极致性能,用他们来作为Intel下代最强性能CPU的参照系再合适不过了。而我们将Core i7 940超频至3.2GHz模仿至尊级XE 965的性能,华硕P6T-Deluxe也代表了最新一批X58芯片组。
测试方法为:每个测试项目都跑三遍,取中间值,三次测试之间误差如果超过5%则成绩无效重新增加测试次数。测试时除必须的驱动程序之外其余都不安装,关闭UAC、屏幕保护程序、系统还原、自动更新等可能影响测试的程序。
驱动上我们使用了通过WHQL认证的正式版驱动,非正式版驱动一般都会存在各种问题,使用正式版驱动稳定性更强。
[b][基准性能测试:3DMAX 9][/b]
3D Studio Max,常简称为3ds Max或MAX,是Discreet公司开发的(后被Autodesk公司合并)基于PC系统的三维动画渲染和制作软件。其前身是基于DOS操作系统的3D Studio系列软件,最新版本是2009。在Windows NT出现以前,工业级的CG制作被SGI图形工作站所垄断。3D Studio Max + Windows NT组合的出现一下子降低了CG制作的门槛,首选开始运用在电脑游戏中的动画制作,后更进一步开始参与影视片的特效制作,例如X战警II,最后的武士等。
[img]http://hardware.mydrivers.com/img/20081016/S01305490.jpg[/img]
在应用范围方面,3D MAX广泛应用于广告、影视、工业设计、建筑设计、多媒体制作、游戏、辅助教学以及工程可视化等领域。拥有强大功能的3DS MAX更多的应用于电视及娱乐业中,比如片头动画和视频游戏的制作,深深扎根于玩家心中的劳拉角色形象就是3DS MAX的杰作。在影视特效方面也有一定的应用。而在国内发展的相对比较成熟的建筑效果图和建筑动画制作中,3DS MAX的使用率更是占据了绝对的优势。根据不同行业的应用特点对3DS MAX的掌握程度也有不同的要求,建筑方面的应用相对来说要局限性大一些,它只要求单帧的渲染效果和环境效果,只涉及到比较简单的动画;片头动画和视频游戏应用中动画占的比例很大,特别是视频游戏对角色动画的要求要高一些;影视特效方面的应用则把3DS MAX的功能发挥到了极至。
测试方法:SPECapc for 3ds max 9 benchmark。
[img]http://hardware.mydrivers.com/img/20081016/01314225.jpg[/img]
在3DMAX 9的测试中我们看到,CPU Render子项的成绩相当不错,领先QX9770接近50%,这款软件对多线程的支持不错,Nehalem Core i7的实力展露无遗。
[b][基准性能测试:PhotoShop CS3][/b]
Photoshop CS3全称Adobe Photoshop CS3 Extended 也称作为Photoshop 10 是目前 Photoshop最新版本。Adobe Photoshop是公认的最好的通用平面美术设计软件。由Adobe公司开发设计。其用户界面易懂,功能完善,性能稳定,所以,在几乎所有的广告、出版、软件公司,Photoshop都是首选的平面工具。
[img]http://hardware.mydrivers.com/img/20081016/S01330346.jpg[/img]
测试方法:PCTEST测试程序,近百张照片进行各种PS特效处理。
[img]http://hardware.mydrivers.com/img/20081016/02040662.jpg[/img]
在PhotoShop CS3的测试里我们看到,Nehalem Core i7的性能表现堪称完美,在除了Size子项测试之外的所有项目中均取得了领先,尤其在Blur子项中的领先优势更是明显,看来对于新一代顶级CPU而言,图像处理已经完全得心应手了。
[b][基准性能测试:WinRAR][/b]
WinRAR 是一款流行好用功能强大的压缩工具。支持鼠标拖放及外壳扩展;完美支持 ZIP 2.0 档案;内置程序可以解开 CAB、ARJ、LZH、TAR、GZ、ACE、UUE、BZ2、JAR、ISO、Z 和 7Z 等多种类型的档案文件、镜像文件和 TAR 组合型文件;具有历史记录和收藏夹功能;新的压缩和加密算法,压缩率进一步提高,而资源占用相对较少,并可针对不同的需要保存不同的压缩配置;固定压缩和多卷自释放压缩以及针对文本类、多媒体类和 PE 类文件的优化算法是大多数压缩工具所不具备的;使用非常简单方便,配置选项也不多,仅在资源管理器中就可以完成你想做的工作;对于 ZIP 和 RAR 的自释放档案文件 ( DOS 和 WINDOWS 格式均可),点击属性就可以轻易知道此文件的压缩属性,如果有注释,还能在属性中查看其内容;对于 RAR 格式(含自释放)档案文件提供了独有的恢复记录和恢复卷功能,使您的数据安全得到更充分的保障。
[img]http://hardware.mydrivers.com/img/20081016/01332646.jpg[/img]
测试方法:WinRAR内置Benchmark。
[img]http://hardware.mydrivers.com/img/20081016/02044115.jpg[/img]
在所有的测试项目里,最能给我们带来直接感受的便是WinRAR了,压缩速度明显提升了很多,这对于办公用户而言意义非常大,3519KB/s的成绩足足领先QX9770有38%,带来的实际性能提升感非常明显。
[b][基准性能测试:DivX、Xmpeg][/b]
DivX只要三个简单的步骤就帮您完成数字影片转DivX文件!软件包含DivX Pro Codec、Divx Player。Dr. DivX的“七种武器”:极易上手的操作界面、全面的输入接口(VCD中的MPEG1文件,SVCD或DVD中的MPEG2文件、DV数字摄像机中的TYPE I-II DV文件、微软公司的WMV文件,以及各种MPEG4、AVI文件,均可以直接交给DivX进行编码压缩,制作成为标准的DivX文件。内建的1394接口DV视频捕捉,以及DVD-VOB分析工具)、丰富的画面校正功能、智能化的参数控制、支持VirtualDUB的各种视频特效滤镜、创纪录的高速压缩、方便批处理等功能。
[img]http://hardware.mydrivers.com/img/20081016/03223975.jpg[/img]
XMPEG是FlaskMPEG的修改版,是一款优秀的DVD编码工具。Lang目录下chinese.lang.Xmpeg为中文语言包,只要把其它语言文件移除即可显示中文。
[img]http://hardware.mydrivers.com/img/20081016/02050532.jpg[/img]
同频率下的Nehalem Core i7在视频编码上的优势相当明显,编码速度超过QX9770有36%左右,看得出Intel在Nehalem的多媒体性能上下了不少的功夫,当然作为玩家而言是更希望在低端产品上也能看到如此明显的进步,关于这一点我们将在以后的测试中去寻求答案。
[b][基准性能测试:Everest Ultimate 4.60][/b]
Lavalys EVEREST,也就是以前著名的AIDA32,是一个测试软硬件系统信息的工具,它可以详细的显示出PC每一个方面的信息。支持上千种(3400+)主板和上百种(360+)显卡,支持对并口/串口/USB这些PNP设备的检测,支持对各式各样的处理器和内存的侦测。EVEREST有Home Edition和Professional两个版本。其中Professional是收费的商业版本,Home Edition则是免费软件。相比Professional,Home Edition只是少了数据分析和数据库连接功能,而在硬件检测方面,Home Edition没有任何缩水。
[img]http://hardware.mydrivers.com/img/20081016/S03443904.jpg[/img]
首先说明各项成绩包含的意义:
CPU Queen是测试CPU的分支预测能力,以及预测错误时所造成的效能影响。
CPU PhotoWorxx著重於CPU的整数运算能力,利用模拟数位影像处理来进行CPU效能的评估
CPU ZLib是另一项针对CPU整数运算的测试,利用Zlib这个压缩函式库,来计算CPU在处理压缩档案时的能力。
CPU AES是一种加密计算测试。
FPU Julia是利用朱利亚碎形几何运算,来评估CPU的单精度(32bit)浮点运算能力。
FPU Mandel则利用了"Mandelbrot″碎形几何运算,来评估CPU的倍精度(64bit)运算能力。
FPU SinJulia则是利用修改过的朱利亚碎形运算,来评估CPU的延伸精度(80bit)浮点运算能力。
[img]http://hardware.mydrivers.com/img/20081016/02055950.jpg[/img]
Everest Ultimate 4.60版对Nehalem Core i7的支持较好,之前版本在VISTA 32bit下会出现蓝屏的问题。从测试成绩来看,Nehalem Core i7的性能表现良好,所有测试项目均领先QX9770,最大单项差距达到50%左右,十分强劲。
[b][基准性能测试:Sisoft Sandra 2009][/b]
[img]http://hardware.mydrivers.com/img/20081016/S01352092.png[/img]
相比EVEREST,SiSoft Sandra 2009更侧重于系统分析与评测,它有超过30种以上的测试项目,主要包括 CPU、Drives、CD-ROM/DVD、Memory、SCSI、APM/ACPI、鼠标、键盘、网络、主板、打印机等。
[img]http://hardware.mydrivers.com/img/20081016/02070364.jpg[/img]
新版本的SiSoft Sandra 2009能更准确客观的反映出Nehalem Core i7的真实水平,可以从成绩里看出,Nehalem Core i7无论在整数,单精度双精度浮点运算上的成绩均远远领先前代产品,最高领先幅度可达84%,Intel的这一个Tock还真给我们带来了很多惊喜。
[b][基准性能测试:PCMark Vantage][/b]
[img]http://hardware.mydrivers.com/img/20081016/S01364721.jpg[/img]
PCMark Vantage可以衡量各种类型PC的综合性能。从多媒体家庭娱乐系统到笔记本,从专业工作站到高端游戏平台,无论是在专业人士手中,还是属于普通用户,都能在PCMark Vantage里了解透彻,从而发挥最大性能。测试内容可以分为以下三个部分:
1、处理器测试:基于数据加密、解密、压缩、解压缩、图形处理、音频和视频转码、文本编辑、网页渲染、邮件功能、处理器人工智能游戏测试、联系人创建与搜索。
2、图形测试:基于高清视频播放、显卡图形处理、游戏测试。
3、硬盘测试:使用Windows Defender、《Alan Wake》游戏、图像导入、Windows Vista启动、视频编辑、媒体中心使用、Windows Media Player搜索和归类,以及以下程序的启动:Office Word 2007、Adobe Photoshop CS2、Internet Explorer、Outlook 2007。
[img]http://hardware.mydrivers.com/img/20081016/02073967.jpg[/img]
在PCMark Vantage这款玩家心中可以说得上是“最权威”的第三方测试软件中,3.2GHz的Nehalem Core i7表现出了新王者的强悍风范,测试项目全部甩开QX9770,其中的Gaming子项领先幅度更是达到了68%,总体得分领先13%。
[b][基准性能测试:3DMark Vantage][/b]
作为业界第一套基于DX10 的综合性基准测试工具,3DMark Vantage在发布前就早早地让众人翘首期盼了。它能全面多核心处理器、发挥多路显卡的优势,能在当前和未来一段时间内满足PC系统游戏性能测试的需求。3DMark Vantage是专门为DX10显卡量身打造的,而且只能运行在Windows Vista SP1操作系统下。它包括两个图形测试项目、两个处理器测试项目、六个特性测试项目。借助于DX10 API的新技术和高效能,它为玩家带来了一场绚丽逼真的视觉特效盛宴。并且,3DMark Vantage还特别加入了对人工智能(AI)和物理加速的专门测试。
[img]http://hardware.mydrivers.com/img/20081016/S01374196.jpg[/img]
测试方法:CPU子项测试。
[img]http://hardware.mydrivers.com/img/20081016/02083042.jpg[/img]
Nehalem Core i7的CPU子项的成绩相当恐怖,Core i7 940在3.2GHz状态下的得分达到了41770,领先QX9770达到30%左右,虽然如此高的CPU得分可能是因为安装了NVIDIA物理驱动,但在同等测试条件下,CPU之间的差距还是很客观的,Nehalem的性能相当强劲
[b][基准性能测试:CineBench R10][/b]
[img]http://hardware.mydrivers.com/img/20081016/S01381090.jpg[/img]
CineBench使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能。Maxon公司表示,相对于之前的9.x版,R10版更能榨干系统的最后一点潜能,准确体现系统性能指标。最新R10版,支持XP、vista、MAC等,最高支持16核。
[img]http://hardware.mydrivers.com/img/20081016/02084828.jpg[/img]
CineBench R10里,无论是单线程还是多线程,Nehalem Core i7在同频率下的性能领先优势明显,总体领先幅度接近40%,Intel高端CPU市场洗牌看来在所难免了。
[b][基准性能测试:Fritz Chess Benchmark][/b]
[img]http://hardware.mydrivers.com/img/20081016/01405467.jpg[/img]
Fritz Chess Benchmark是一款国际象棋测试软件,但它并不是独立存在的,而是《Fritz9》这款获得国际认可的国际象棋程序中的一个测试性能部分。它可以让我们的X86计算机也能完成IBM“深蓝”当初所做的事情,那就是计算国际象棋的步法预测和计算,虽然现在我们的个人电脑依然无法与10年前IBM的“深蓝”相提并论,并且无论是在处理器架构方面、节点方面还是AIX操作系统方面都有很大的差距,但是Fritz Chess Benchmark依然是目前在个人计算机方面最好的步法计算和预测软件,同时也可以让我们对等的看到目前我们所使用的个人计算机到底达到了一个什么样子的水平。同时该软件还给出了一个基准参数,就是在P3 1.0G处理器下,其可以每秒运算48万步。
[img]http://hardware.mydrivers.com/img/20081016/02093840.jpg[/img]
Nehalem Core i7在“国际象棋”里的表现依然精彩,11583千步/秒的速度力压前代王者QX9770,作为Intel高端市场的“面子产品”,Nehalem Core i7 940在3.2GHz下的性能非常强劲,在这个级别的市场上竞争对手暂时是拿不出能与之抗衡的产品的。
[b][基准性能测试:ScenceMark 2.0][/b]
[img]http://hardware.mydrivers.com/img/20081016/S01445981.jpg[/img]
ScienceMark是一款体现处理器整数运算和浮点处理能力的测试软件,最新版本支持超线程技术。Sciencemark本是被设计出来用以模拟真实科学应用环境的,通过对计算水分子总能量、钷元素求量子解、氩原子分子动力学模拟等项目测试计算机内存、仿真分子动态效能和浮点精准效能。
[img]http://hardware.mydrivers.com/img/20081016/02102871.jpg[/img]
科学运算需求的就是更强的CPU整数和浮点运算性能,而Nehalem Core i7显然在这方面做得比前辈更好,整体成绩领先QX9770有20%左右,表现值得赞叹。
[b][基准性能测试:Super Pi Mod 1.5][/b]
[img]http://hardware.mydrivers.com/img/20081016/02130070.jpg[/img]
Super PI是一款专用于检测CPU稳定性的软件,软件通过计算圆周率让CPU高负荷运作,以达到考验CPU计算能力与稳定性的作用。该软件的使用很简单,下载运行后,单击软件主界面“计算”菜单,软件将弹出对话框让你选择要计算的圆周率位数(如图7),计算的位数越多,检测时间越长,对CPU的考验也越大。通常一般情况下可以选择104万位的运算,如果要求较高则可以选择209万位的运算。如果CPU能够在最高的3355万位的检测中通过,则该CPU将能够在非常苛刻的环境下稳定运行。
[img]http://hardware.mydrivers.com/img/20081016/02111285.jpg[/img]
3.2GHz的Nehalem Core i7运算一百万位的Pi可以达到12.8秒的好成绩,虽然不能和那些超频玩家的成绩相比,但在默认频率下与其他参测平台对比起来的性能表现是相当不错的,而目前已经有玩家将Core i7 965 XE超频到了4.2GHz,此时的成绩想必更加惊人。
[b][游戏性能测试:《冲突世界》][/b]
PC版《冲突世界》来自瑞典游戏开发商Massive Entertainment,是一款采用DX10技术的RTS即时战略大作,在游戏界评价最高的PC游戏之一,多次获得最佳战略游戏提名。作为首批DirectX 10游戏,它还依托全新开发的强大图形引擎,在云层、光照、阴影、爆破效果方面都表现得非常出色。它把玩家带入苏联依然存在的世界格局之中,描述了众多超级大国征战第三次世界大战的场景。
[img]http://hardware.mydrivers.com/img/20081016/S01493404.jpg[/img]
测试分辨率为1024x768和1280x800,画面设置全为High,测试方法为游戏内置Benchmark程序。
[img]http://hardware.mydrivers.com/img/20081016/02133887.jpg[/img]
[img]http://hardware.mydrivers.com/img/20081016/02135307.jpg[/img]
Nehalem Core i7在游戏里的表现并不像之前那样有明显领先,与QX9770基本持平,而双核E8500则稍稍落后,造成这样的结果的原因可能是因为游戏厂商还未对Nehalem Core i7进行优化的缘故。
[b][游戏性能测试:《Crysis》][/b]
Crytek出品的《Crysis》绝对是近年最受关注的PC游戏,其DX10最高画质下的画面水平已经在向电影化靠拢的路上迈出了一大步。遗憾的是,其高配置要求曾经导致相当多的用户根本没看过特效全开的《Crysis》画面效果。游戏发生在一个如史前公园般美轮美奂的热带小岛上,如画般的沙滩,细致得令人心动的丛林,清澈得让人情不自禁想跳下去的水,都在向我们展示着下一代游戏应有的样子。它如此惊艳的游戏视觉效果就只能用一句话来形容:它值得你为它购置一台全新电脑。它将灵活刺激的游戏体验与惊人的视觉效果相结合,轻松成为有史以来最好的射击游戏之一。
[img]http://hardware.mydrivers.com/img/20081016/S01501357.jpg[/img]
测试分辨率为1024x768和1280x800,画面设置全为High,测试方法为游戏内置CPU Benchmark程序。
[img]http://hardware.mydrivers.com/img/20081016/02170298.jpg[/img]
[img]http://hardware.mydrivers.com/img/20081016/02174350.jpg[/img]
在《Crysis》里Nehalem Core i7的表现依然不突出,多次测试依然与QX9770在相等水平上,看来对于游戏的优化目前还不算很好,而且可以看出对于游戏而言,还是GPU更加重要。
[b][游戏性能测试:《英雄连》][/b]
由Relic开发和THQ发行的人气大作《英雄连》续作——《英雄连之抵抗前线》(Company of Heroes Opposing Fronts)将采用DX10引擎制作,展现强大的画面效果。本作的剧情主要发生在二战的“市场花园”战役期间,玩家可操控盟军的英国部队和法国的抵抗运动势力,以及德国的装甲部队。资料片将使用升级版Essence引擎,支持DirectX 10,加强了物理效果,支持动态天气系统,加强了车辆和士兵的AI。前作是以美军诺曼底登陆为故事主轴讲述的,资料片则选择了英军解放法国卡昂的故事,游戏中可以选择英军和德国装甲兵,都有各自完整的任务模式。
[img]http://hardware.mydrivers.com/img/20081016/S01514882.jpg[/img]
测试分辨率为1024x768和1280x800,画面设置全为High,测试方法为游戏内置Benchmark程序。
[img]http://hardware.mydrivers.com/img/20081016/02211948.jpg[/img]
[img]http://hardware.mydrivers.com/img/20081016/02220895.jpg[/img]
在《英雄连》里我们继续看到Nehalem Core i7与QX9770表现相当,说实在的测试到这里确实有一点遗憾,Nehalem Core i7在游戏上的表现确实没有达到我们想想的那么神奇,但这也极有可能是因为游戏软件的缘故,我们将在以后的测试中继续关注Nehalem Core i7在游戏里的表现。
[b][游戏性能测试:《半条命2第二章》][/b]
Havok引擎虽然还不是世界三大引擎之一,但是其优越的性能和对DirectX的良好支持利用让众多游戏开发商青睐。除了半条命2使用了havok引擎之外,比如《Max Payne》(马克思佩恩,中文游戏名为英雄本色)、帝国时代3和即将出炉的大作F.E.A.R(First Encounter Assault Recon)都使用了这个引擎。Havok是世界上最早支持DX9.0的引擎之一,其优秀的扩展性和跨平台性使得它的应用变得快捷和简单。在游戏第二章中首次采用了Valve自主研发的Source渲染物理引擎,使游戏具有真实世界中的物理表现。给游戏增添了巨大的真实感。
[img]http://hardware.mydrivers.com/img/20081016/S01542746.jpg[/img]
测试分辨率为1024x768和1280x800,画面设置全为High,测试方法为游戏内置Benchmark程序。
[img]http://hardware.mydrivers.com/img/20081016/02342693.jpg[/img]
[img]http://hardware.mydrivers.com/img/20081016/02344059.jpg[/img]
在《半条命2第二章》里,Nehalem Core i7表现中规中距,在这个帧数上玩家不会感到三者之间有什么性能区别。
[b][游戏性能测试:《失落星球》][/b]
虽然《Crysis》一直号称是全球首款DX10游戏,但一再的跳票却让另一款游戏走到了前头,就是《失落的星球:极限状态》(Lost Planet: Extreme Condition)。在《失落星球:极限状态》中,地球上的人类为了生存而奔向太空,移民到了一个遥远的被冰雪所覆盖的荒芜星球“EDN-3rd”。那里生活着一种奇特而恐怖的生物“Akrid”,它们是这个星球的原住民,对人类是一种极大的威胁,但其体内蕴藏着新的能源“T-ENG”,而这正是人类梦魅以求的。大战不可避免。
开发商Capcom此次一共发布了两个Demo,分别针对DX9模式和DX10模式,前者支持XP和Vista,后者仅限Vista。两个Demo里都有两个关卡,任务分别是攻击Akrid基地和袭击冰上海盗堡垒。
[img]http://hardware.mydrivers.com/img/20081016/S01553717.jpg[/img]
测试分辨率为1024x768和1280x800,画面设置全为High,测试方法为游戏内置Benchmark程序。
[img]http://hardware.mydrivers.com/img/20081016/02381196.jpg[/img]
[img]http://hardware.mydrivers.com/img/20081016/02384512.jpg[/img]
《失落星球》的测试再次重复了前面测试的结果,Nehalem Core i7对游戏性能的提升确实非常有限,想靠Nehalem Core i7来拉升游戏表现的玩家可能会失望了,至少目前而言几款主流游戏都无法在Nehalem Core i7的协助下得到很大提升。
[b][测试总结及感想][/b]
作为Intel下一代的顶级最强CPU,Core i7的性能相当强悍,基本上在所有的非游戏类项目中都甩开了上代皇者QX9770,同频下20-30%的性能优势给人带来的加速体验非常完美,在一些运算量不重的多线程程序下的表现几乎就是一个小号的“Skulltrail”平台,比如在Sisoft Sandra 2009里的表现就非常出色,远远超过对比平台产品。
说完好的,我们来说点不足的:首先,目前的很多软件对于CPU多核心优势的利用还很不到位;其次,还没有什么软件能真正的利用到Nehalem的内置内存控制器,而当年AMD将内存控制器植入CPU内部时我们在大多数的程序里都看到了近20%的性能提升;HT超线程技术目前还发挥不出水平;游戏性能的提升有限,从此也看得出,对于游戏爱好者而言,想要玩爽游戏,使用更高端的GPU才是最好的方案。
[img]http://hardware.mydrivers.com/img/20081016/S02441350.jpg[/img]
售价方面Intel Core i7 Extreme Edition i7-965(3.2GHz,8MB L3, LGA1366, Product Code BX80601965 , QPI 6.4GT/sec),预计售价为999美元。Intel Core i7-940(2.93GHz,8MB L3, LGA1366, Product Code BX80601940, QPI 4.8GT/sec),预计售价为562美元。Intel Core i7-920 (2.66GHz,8MB L3, LGA1366, Product Code BX80601920, QPI 4.8GT/sec),预计售价为284美元。最受关注的恐怕就是频率最低,价格也最低的Intel Core i7-920了,它的超频性能到底如何,价格能否更降一步等等问题都饱受玩家追问。
[img]http://hardware.mydrivers.com/img/20081016/02472423.png[/img]
还有大家关注的内存/CPU电压问题,虽然有很多文章指出Nehalem的CPU电压和内存电压是同步增减的,但我们只能说基于不同的BIOS设计,就会出现不同的情况,Intel倒是很明确的指出了如果将电压设置超出1.50V-1.65V的范围外,就有可能会影响CPU的使用寿命。虽然在以往的测试中我们很习惯将电压调节到一个很高的范围来求得更好的性能水平,但这一次我们强烈建议所有的玩家都尽量将电压值保持在Intel规定的范围内,在不久的将来,内存厂商们很可能会生产一些低电压的DDR3-1066至DDR3-1600内存,并且保持相当低的延迟,目前的JEDEC规格DDR3也能完全正常的运行在X58上,只是延迟稍高了一些。
但笔者个人还是坚持认为,如果在一款做工设计优秀的主板,一套不错的散热装备以及出色的BIOS设计下,1.7-1.8V的电压也是可以接受的(纯笔者个人意见),这样今后的高频低压版DDR3内存就能在相对较低的电压下实现1866-2200MHz的频率,虽然并不能满足极端发烧友的需求,但对于大多数玩家而言已经可以接受了。笔者的个人感受就是如果在三通道状态下以1.65V实现DDR3-1333 5-5-5-12或者DDR3-1500/ 1600 6-6-5-15的话,内存带宽也是相当可观的。所以对于i7/X58玩家而言,是不会出现类似P45/X38/X48用户那种低频高延迟内存的影响的。