Xeon Phi加速處理器細節(jié):最多61核心、300W
六月份,Intel正式發(fā)布了首款基于IMC眾核架構、22nm Knights Corner核心的加速處理器“Xeon Phi”,Larrabee借此重生,準備與NVIDIA Tesla、AMD Fusion等等在高性能計算領域一較高下。不過,Intel當時并未公布太多技術細節(jié),規(guī)格上語焉不詳。
上周,Intel開始向合作伙伴提供B0步進的Xeon Phi芯片樣品,我們也得到了比較詳細的技術參數(shù)。
昨天——
Larrabee獨立顯卡項目失敗后,Intel并未放棄,而是撿起了“Aubrey Isle”核心與合作伙伴繼續(xù)試驗,而搭載此核心的擴展卡代號“Knights Ferry”,2010年三月正式亮相,并稱之為“MIC”眾核架構。
Aubrey Isle采用的是45nm工藝,32個核心,1MB一級緩存,8MB二級緩存,主頻1.2GHz,搭載2GB GDDR5顯存,位寬達到驚人的1024-bit,而且是環(huán)形總線設計,熱設計功耗300W左右。
Knights Ferry擴展卡可以執(zhí)行x86標準代碼,能提供750GFlops的單精度浮點性能,雙精度效率41-47%,也就是不到400GFlops。至于這塊卡出貨了多少,誰也不清楚,反正難得一見,畢竟只是個試驗品。
2011年初,準備采用22nm工藝的新核心“Knights Corner”出現(xiàn)了,BIOS、PCB、規(guī)格都有很多版本。A0步進的有48、52、60個核心,1.5-1.9MB一級緩存,24-30MB二級緩存,顯存拋棄環(huán)形總線,位寬縮減到512-bit(待確認),容量2、4、8GB GDDR5,等效頻率不過2.4-4.5GHz,主頻也只有1GHz,因為即便這樣熱設計功耗也有300W了。
60核心版本曾經(jīng)演示過1TFlops的單精度浮點性能,但雙精度比較慘淡,不足以成氣候。
Intel隨后準備繼續(xù)發(fā)展B0、C1等新步進,并且計劃盡快出貨,以登上2013年六月的全球超級計算機五百強名單。
今天——
B0就是現(xiàn)在的步進版本,ES2版工程樣品,進步很大,引入了一些非常必要的功能特性,BIOS也做了全面完善。
核心數(shù)量為57、60、61個(很不規(guī)整的數(shù)字),一級緩存1.8-1.9MB,二級緩存28-30.5MB,顯存增加到3、6、8GB GDDR5。
頻率方面有多種不同設定,57核心3/6GB顯存的600-1100MHz,60/61核心8GB顯存的則是630-1050/1090MHz,顯存頻率達到了5000-5500MHz,帶寬超過300GB/s。
值得一提的是,Intel這次引入了Turbo動態(tài)加速技術,類似桌面上的睿頻,但具體多少個核心能加速到什么程度不詳。
熱設計功耗,57核心3GB顯存、60核心6GB顯存的是245W,57核心6GB、61核心8GB(兩種版本)的則是300W。
散熱方案有主動風扇、被動靜音兩種,其中被動靜音的用于自備大風量的機架系統(tǒng),但也有完全無散熱的,用于自行安裝水冷等其它散熱器。順便說一句,這些卡很重很重。
具體性能沒有實際數(shù)據(jù),Intel的內(nèi)部目標是單精度2TFlops、雙精度1TFlops,從已知情況看難度不大。
C1步進還沒出來,會是什么樣子還有待觀察。
再往后,還有第二代“Knights Landing”,Intel對高性能計算的追求不會停歇