2009年:英特爾與AMD服務(wù)器市場對對碰
為很值得期待,但我們也沒有忘記在x86服務(wù)器CPU市場中,并不是英特爾的獨角戲,它頑強的競爭對手AMD仍然在這個市場中擁有著自己可觀的支持者。而在2008年里,AMD推出了其第一代45nm處理器“上海”(Shanghai),雖然仍然屬于第三代Opteron(晧龍)家族,但也有很多細微的變化,這無疑將使得2009年的服務(wù)器市場越發(fā)精彩。那么我們就來看看在新的一年中,英特爾與AMD將呈現(xiàn)出怎樣的競爭態(tài)勢。
AMD新軍“上海”:神秘與困惑并行
在2008年的11月13日,AMD正式推出了其首款45nm Opteron處理器,但并沒有以第四代Opteron自居,從中可以看出它與第三代Opteron仍然是一家人,也就預示著其在內(nèi)部結(jié)構(gòu)上并沒有質(zhì)的變化,而更多的是一種“量變”式的增強。不過,在AMD的介紹中,筆者倒是覺得有些困惑,也讓這款處理器顯得有些神秘。
首先,我們知道AMD引以為榮的點對點處理器互聯(lián)架構(gòu)是其一大法寶,這個架構(gòu)的基礎(chǔ)就是AMD主導開發(fā)的開放式點對點總線技術(shù)HyperTransport,簡稱HT。從早前的第三代65nm Opteron(即Barcelona,巴塞羅那)的介紹中,我們可以看出它就已經(jīng)采用了3條HT總線的設(shè)計,而在這一點在“上海”身上并沒有變化,可是在一些規(guī)格上卻有了不同
在Barcelona的設(shè)計中,雙路的2xxx中3條HT總線中有一條負責與另外的CPU互聯(lián),另外兩條負責I/O處理,8xxx的3條HT都可用于CPU的互聯(lián),每條HT總線的總位寬是16bit。根據(jù)AMD的計劃,將會全面推行HT 3.0標準,那么以現(xiàn)有的規(guī)格計算,采用2GHz時鐘的HT 3.0在16bit總位寬下的帶寬正好是8GB/s,三條共24GB/s,與其宣傳相符。也就是說,Barcelona用于CPU間互聯(lián)的帶寬為8GB/s,可是在Shanghai的新特性介紹中,我們看到的數(shù)值卻遠高于此AMD給出的Shanghai新特性介紹,包括了45nm工藝帶來的好處(比如更高的主頻,更節(jié)能)、可支持DDR2-800(Barcelona只支持到DDR2-667)、可以更節(jié)能的智能預取、增強的快速虛擬化索引(RVI)以及更高的CPU間互聯(lián)帶寬,上圖標注的17.6GB/s明顯高于Barcelona的8GB/s
這點讓筆者有些琢磨不透,而在上海的發(fā)布會上,我們也確定了其并沒有在HT頻率上做什么明顯的手腳,仍然在HT 3.0的范圍內(nèi)。那么我們的疑問來了,在4.4GTs的傳輸率下,如何達到17.6GB/s的總帶寬呢?顯然位寬是32bit,可Barcelona的設(shè)計是3條各16bit的HT總線,每條最高8GB/s的帶寬。如果Shanghai是在Barcelona的基礎(chǔ)上改進而來,那么在總體的架構(gòu)上就不可能很大的變動,但CPU間互聯(lián)帶寬提升如此之大,我們也就有足夠的理由懷疑了。對此,筆者分析有兩種可能:
1、AMD的介紹有些誤導,17.6GB/s是指CPU的I/O總帶寬而不是CPU間互聯(lián)的帶寬,如果這么考慮,那一切也就順理成章了(兩條HT總線,總位寬32bit,傳統(tǒng)率為4.4GTs)。
2、Shanghai將兩條HT用在CPU間的互聯(lián),只有一HT用在了I/O。
如果細分析,我認為,第二種可能性很小,因為Shanghai還有4路/8路的設(shè)計,但HT總共就3條,若是用兩條HT來聯(lián)接CPU顯然是不合理的,所以筆者最終斷定Shanghai的CPU互聯(lián)帶寬現(xiàn)在仍然是8GB/s,到2009年第二季度全面升級后將提升至8.8GB/s。
對比英特爾的Nehalem架構(gòu),我們就能看出來Opteron原先的HT優(yōu)勢在2009年面對前者的QPI總線(Nehalem-EP的CPU間互聯(lián)與I/O帶寬均為25.6GB/s)時以處于下風,這主要體現(xiàn)在傳輸位寬小,傳輸頻率低。當然,HT也是在進步的,在2008年7月23日,HT組織發(fā)布了最新的HT 3.1標準,從中可以看出至于在頻率上與QPI已經(jīng)相當了,可是Opteron
特性比較 | HT 1.0 | HT 2.0 | HT 3.0 | HT 3.1 |
最大時鐘頻率 | 800Mhz | 1.4Ghz | 2.6Ghz | 3.2Ghz |
最大傳輸速率 | 1.6GT/s | 2.8GT/s | 5.2GT/s | 6.4GT/s |
最大總線帶寬(每項32位,雙向合計) | 12.8GB/s | 22.4GB/s | 41.6GB/s | 51.2GB/s |
AC操作 | NO | NO | Yes | Yes |
通過AD/DC自動檢測與配置進行電容遇合 | ||||
鏈路分割(非固定連接) | NO | NO | Yes | Yes |
每個HT鏈路可分割為兩個1/2位寬的鏈路 | ||||
熱插拔 | No | No | Yes | Yes |
動態(tài)鏈路時鐘/帶寬調(diào)整 | No | No | Yes | Yes |
DirectPacket數(shù)據(jù)流 | 僅1.1 | Yes | Yes | Yes |
可增加16個虛擬通道(總共22個),支持對等網(wǎng)絡(luò)聯(lián)接,本地封包處理 | ||||
PCI Express影射 | No | Yes | Yes | Yes |
其次,另一個讓比較迷惑的一點就是仍然采用DDR2內(nèi)存,這在當前大談綠色節(jié)能的背景下,顯得有些不可思議。DDR2的接班人DDR3在節(jié)能方面有著更好的表現(xiàn)(工作電壓降低了0.3V,理論能耗降低了16.7%),而且傳輸頻率比DDR2要高出近一倍。如果說DDR3因為成本的原因不會在臺式機市場過快的普及,但對于更注重能耗的移動和服務(wù)器市場,DDR3理應更受關(guān)注(當初DDR2內(nèi)存也是率先在這兩個市場普及的)。也許Shanghai是為了最大限度與現(xiàn)有市場兼容,歷史上AMD也向來是穩(wěn)扎穩(wěn)打的,勇于挑起產(chǎn)業(yè)變化的是其競爭對手英特爾(如Rambus DRAM和FB-DIMM的采用,此次DDR3也走在了前面)。但我們可以注意到,在HT總線上,雖然AMD宣稱Shanghai可以向下兼容,可是如果要想達到最佳的效果,還是必須要有新的支持4.4GTs的平臺,那么為什么不能勇敢的采用DDR3呢?按照AMD的路線圖,到2010年才會轉(zhuǎn)向DDR3平臺,我甚至有些懷疑是不是AMD在技術(shù)開發(fā)能力上出現(xiàn)了什么問題?
總之,AMD長期以來最值得驕傲的兩大優(yōu)勢——點對點傳輸總線與集成內(nèi)存控制器,在Shanghai這一代將不復存在,反而將要開始追趕后來居上的對手,這的確讓筆者有些感嘆。
因此不得不說,Shanghai的發(fā)布在筆者的眼中有些神秘和困惑。當然相對于Barcelona的進步肯定是有的,主頻與內(nèi)存帶寬的提升無疑對性能有直接的幫助,只是如果自己進步的步伐不如手快的話,那么就要相當小心了。