AMD“推土機(jī)”和Intel Xeon 5600以及 Xeon E7性能評測對比
AMD新一代處理器架構(gòu)Bulldozer(推土機(jī))在兩年前就已經(jīng)引起業(yè)界的廣泛注意,由于其新穎的“物理雙線程”設(shè)計(jì)讓很多人對于AMD首次涉足多線程領(lǐng)域的表現(xiàn)非常期待。2009年11月11日,AMD正式明確了Bulldozer的架構(gòu),而隨著日后Bulldozer的細(xì)節(jié)公布,本站也做了相應(yīng)的報(bào)道,其雙核模塊的設(shè)計(jì)確實(shí)讓人眼前一亮,好奇心也因此更上一層樓。近日,桌面版的Bulldozer處理器率先亮相,8核心的FX8100與4核心的FX4100的評測已經(jīng)鋪天蓋地,而11月14日,面向企業(yè)級應(yīng)用市場的皓龍(Opteron)版Bulldozer終于正式亮相,分別是最高16核心/8模塊的Opteron 6200系列與最高8核心/4模塊的Opteron 4200系列。由此也正式向世人宣布了AMD的最新服務(wù)器平臺。在AMD的聲明中強(qiáng)調(diào),新一代基于Bulldozer的皓龍?zhí)幚砥鲗樵茣r(shí)代提供強(qiáng)大的動(dòng)力,同時(shí)也為企業(yè)帶來高效、節(jié)能的基礎(chǔ)運(yùn)算平臺。那么從理論到實(shí)踐,從期盼到現(xiàn)實(shí),Bulldozer能為將來的云“推”出多大 的天空任其馳騁呢?我們今天就來做一分析,而重點(diǎn)就是Opteron 6200系列。
Opteron 6200處理器新特性簡介
有關(guān)Bulldozer處理器架構(gòu)的介紹,已經(jīng)有很多了,但為了文章的完整性,我們今天也在此做一簡單的回顧與介紹(參見上面提到的本站專文),首先要明確的是,從Bulldozer開始,傳統(tǒng)意義上的“CPU核心”的概念已經(jīng)有了變化。
Bulldozer的“模塊”架構(gòu)圖,可以看作是兩個(gè)整數(shù)處理核心共享一個(gè)浮點(diǎn)處理單元的設(shè)計(jì) ,因?yàn)槿粘5奶幚磉\(yùn)算中,更多的是整數(shù)處理,所以這就變向的等于在一個(gè)模塊可以同時(shí)處理兩個(gè)整數(shù)處理線程,而無需共享處理管線
AMD當(dāng)初開發(fā)Bulldozer架構(gòu)的初衷在于,經(jīng)調(diào)查發(fā)現(xiàn)日常的IT應(yīng)用主要集中于整數(shù)運(yùn)算,而浮點(diǎn)運(yùn)算相對較少。為了提高多線程處理的性能,AMD設(shè)想可不可以用2+1的方式來解決,即兩個(gè)整數(shù)處理核心+1個(gè)浮點(diǎn)處理單元,以組成一個(gè)新架構(gòu)的處理單元——Module(模塊)。 眾所周知,在多線程處理方面,英特爾最早提出了Hyper-Threading(超線程)的理念,可以使操作系統(tǒng)或者應(yīng)用軟件的多個(gè)線程,同時(shí)運(yùn)行于一個(gè)超線程處理器上,其內(nèi)部的兩個(gè)邏輯處理器共享一組處理器執(zhí)行單元。而AMD CPU的兩個(gè)線程使用各自的單元,但兩個(gè)線程是共享命令解碼器和浮點(diǎn)運(yùn)算等資源的。因?yàn)槭钦麛?shù)運(yùn)算,所有線程之間沒有沖突,因此吞吐量有所提高。
從芯片級別看Bulldozer模塊,每個(gè)模塊擁有自己的L2緩存,L3緩存則為晶片級共享
Opteron 6200與4200的晶片設(shè)計(jì)圖,4200由單晶片(功能單元略有不同)構(gòu)成,最多4個(gè)模塊(8核心),6200由兩塊該晶片組成,最多8個(gè)模塊(16個(gè)核心)
由于這種2+1的核心設(shè)計(jì),在Bulldozer的架構(gòu)中,其核心(Core)的概念已經(jīng)與傳統(tǒng)認(rèn)識有了較大的不同,單一的核心并不是一個(gè)具備完整功能的處理單位,所以AMD一直在用Bulldozer Module來表示Bulldozer處理器的處理單元,所以在后文的介紹中,對于Opteron 6200我們也將用模塊和核心兩個(gè)概念表述——在這里,核心是指組成模塊中的整數(shù)處理單元,它們共享一個(gè)彈性浮點(diǎn)處理單元(Flex FP)。
Opteron 6200的內(nèi)部架構(gòu)圖,相當(dāng)于用兩塊4200組成,兩個(gè)芯片之間由HyperTransport總線互聯(lián)
在Bulldozer架構(gòu)中,非常值得一提的是由兩個(gè)整數(shù)處理核心共享的Flex FP處理單元與新增加的獨(dú)家指令集。這一Flex FP由兩個(gè)128bit FMAC(Fused Multiply–Add Capability,混合乘加)處理單元組成,之所以稱為彈性(Flex),是因?yàn)檫@兩個(gè)單元可以各自獨(dú)立,為每個(gè)整數(shù)核心提供獨(dú)享的128bit浮點(diǎn)處理單元(此時(shí)可以認(rèn)為是兩個(gè)具備有整數(shù)運(yùn)算+128bit浮點(diǎn)運(yùn)算單元的處理核心,組成了Bulldozer Module),也可以組合成一個(gè)256bit的浮點(diǎn)處理單元為一個(gè)模塊提供服務(wù),這其實(shí)給編程人員提供了很好的彈性,但也預(yù)示著對現(xiàn)有的應(yīng)用需要進(jìn)一步的優(yōu)化。 #p#page_title#e#
Opteron 6200與6100、英特爾的SandyBridge之間的浮點(diǎn)處理模式的對比
簡單來說,這種兩個(gè)128bit單元彈性組合的方式,提供了有多種指令處理的模式,比如對于同時(shí)執(zhí)行兩個(gè)128bit的AVX指令,SandyBridge單一的256bit FP單元就不行了,而Flex FP則可以,同樣的,這也適用于SSE指令。所以,AMD強(qiáng)調(diào),除非是256bit的AVX指令環(huán)境,否則6200的單周期浮點(diǎn)處理能力是SandyBridge的兩倍,顯然靈活的可分拆也可組合的Flex FP功不可沒。
Opteron 6200除了具備與英特爾SandyBridge相同的指令集外,還獨(dú)家提供了兩套指令集
目前主流的編譯器大多已經(jīng)支持AMD的FMA4和XOP指令集
而為了發(fā)揮Flex FP的強(qiáng)大的威力,AMD也專門開發(fā)了兩套針對浮點(diǎn)運(yùn)算的指令集FMA4與XOP,兩者可以說都是為高性能計(jì)算所服務(wù),但側(cè)重點(diǎn)不太相同,F(xiàn)MA4更有針對性,比如向量和矩陣計(jì)算、多項(xiàng)式評估、數(shù)據(jù)信號處理等,而XOP則針對數(shù)學(xué)、多媒體應(yīng)用等。目前,主流的編譯器大多已經(jīng)全部或部分支持AMD的新指令集,因此在發(fā)揮Bulldozer的浮點(diǎn)威力方面,還是很讓人期待的。
新一代Opteron 6200/4200的主要特性
說完主要的處理架構(gòu)的亮點(diǎn)外,我們再來看看其他方面的改。AMD強(qiáng)調(diào)了新一代處理器在三個(gè)方面的靈活性優(yōu)勢,分別是處理性能的靈活性,能耗的靈活性與平臺及虛擬化的靈活性。而相較上一代的6100處理器平臺,我認(rèn)為前兩者的改進(jìn)最為明顯。
Opteron 6200與6100對比,請注意整數(shù)處理的每周期發(fā)射數(shù)的提高(預(yù)示整數(shù)性能提升更明顯)、Turbo CORE超頻、C6能耗控制等新的變化
每個(gè)核心都有6個(gè)能耗/性能等級(P-States),可以根據(jù)TDP的設(shè)定而將最高性能限制在某一等級之下,而當(dāng)與TurboCORE技術(shù)相配合時(shí),我們能發(fā)現(xiàn)又多出兩個(gè)等級,以提供最強(qiáng)的核心性能。在Opteron 6200平臺上,用戶可以在BIOS中通過AMD新推出的TDP Power Cap功能設(shè)定總功耗限制,而P-States也就會(huì)做出相應(yīng)的限定
新增加的C6能耗控制狀態(tài),在這一狀態(tài),空閑的模塊可以單獨(dú)進(jìn)入C6狀態(tài),此時(shí)模塊停止供電與時(shí)鐘信號,從而可最多節(jié)省95%的能耗。在Bulldozer處理器,每個(gè)模塊的狀態(tài)將保存在內(nèi)存中
AMD TurboCORE技術(shù)實(shí)現(xiàn)了類似于英特爾“睿頻”(TurboBoost)的功能
我們已經(jīng)對英特爾的“睿頻”技術(shù)有所了解,它可以在處理器的能耗不超出TDP功率限制的前提下,根據(jù)應(yīng)用的性能需求,提升處理器核心的運(yùn)行頻率以最大限度挖掘核心的處理性能,而在Opteron 6200上也同樣具備了這一能力,它就是AMD 的TurboCORE技術(shù),它可分為兩個(gè)模式。一種是All Core模式,所有的模塊都可以提升300至500MHz的主頻,另一種是Max Turbo,即如果一些輕負(fù)載線程讓一半的模塊可以將進(jìn)入C6狀態(tài),但余下的模塊又需要最大的處理性能,此時(shí)可以在All Core的基礎(chǔ)上再增加500MHz(即最高可超頻1GHz)。
Opteron 6200處理器價(jià)格信息與規(guī)格比較
我們在4月份曾做過Opteron 6100與至強(qiáng)7500和5600之間的對比。今天將延續(xù)我們以往的風(fēng)格,我們在此會(huì)列出Opteron 6200的規(guī)格信息,以及與Opteron 4200的價(jià)格信息,并將開始與主要的競爭對手進(jìn)行對比。在這里需要強(qiáng)調(diào)的是,從6100系列來,AMD就放棄了4路以上的服務(wù)器市場,并且主攻雙插槽市場,這一點(diǎn)與英特爾的戰(zhàn)略明顯不同。所以,AMD將Opteron 6200定位于主流的雙插槽及4路服務(wù)器市場,4200則主要是面向云計(jì)算集群應(yīng)用以及輕負(fù)載的企業(yè)應(yīng)用,只有雙插槽平臺可供選擇。
Opteron 6200與Opteron 4200的官方報(bào)價(jià),4200最低價(jià)為125美元,6200最高為1019美元
年初發(fā)布的6100系列處理器的價(jià)格表,可以看出6200居然更便宜
24.jpg
英特爾E7處理器的價(jià)格,4路型號最高價(jià)格4394美元,雙插槽最高價(jià)格4227美元,相比之下Opteron 6200太廉價(jià)了……
25.jpg
與6100一樣,6200同樣面對兩個(gè)強(qiáng)大的對手,但4路平臺從至強(qiáng)7500換成E7,而雙插槽平臺仍然是至強(qiáng)5600
以價(jià)格段為區(qū)間,至強(qiáng)5600與Opteron 6200的型號對位表,這也將影響到我們下面的評測處理器的選擇