CAE軟件運(yùn)行與多核配置特點(diǎn)分析
從上世紀(jì)60年代計(jì)算機(jī)問世以來,計(jì)算機(jī)技術(shù)歷經(jīng)了半個(gè)世紀(jì)的緩慢發(fā)展。直到2000年前后,這場以計(jì)算機(jī)互聯(lián)和資源共享的第三次工業(yè)革命才發(fā)展至高潮,新興信息技術(shù)如雨后春筍般涌現(xiàn)。
進(jìn)入21世紀(jì)之后,硬件技術(shù)的發(fā)展與軟件技術(shù)發(fā)展呈現(xiàn)了不一樣的趨勢,硬件技術(shù)的更新似乎總領(lǐng)先于軟件版本的更新。而企業(yè)購買硬件產(chǎn)品,歸根到底是為了更好的應(yīng)用軟件,具體到制造企業(yè)就是更好的應(yīng)用CAD、CAE等涉及到大量運(yùn)算、對CPU和內(nèi)存要求較高的軟件產(chǎn)品。
為了探尋日前多核CPU對3D CADCAE運(yùn)算效率的提升,e-works近期策劃了主題為“四核CPU,超前消費(fèi)還是量入為出”的專題研討,采訪了活躍在中國市場的主流3D CAD和CAE主流廠商,了解它們提供的3D CADCAE軟件對于多核技術(shù)的支持,并調(diào)研了部分企業(yè)的應(yīng)用情況。在仔細(xì)分析大量觀點(diǎn)、查閱相關(guān)資料的基礎(chǔ)上,形成本報(bào)告,力求從中正、客觀、全面的角度反映“四核CPU對3D CADCAE運(yùn)算效率”的關(guān)系。
第一部分:四核CPU普及正當(dāng)時(shí)?
一 供應(yīng)商協(xié)力推廣多核CPU技術(shù)
Intel的首席技術(shù)執(zhí)行官不止一次指出,軟件的開發(fā)和生產(chǎn)跟不上不斷提高的計(jì)算機(jī)硬件水平。也確是如此,隨著計(jì)算機(jī)硬件技術(shù)的發(fā)展,CPU業(yè)界于2005年發(fā)生了一次里程碑意義的革新,從2005年第一款雙核處理器面世起,市場得到了迅速響應(yīng),并以雙核最終取代了單核,得到了全面普及。核心數(shù)量決定了CPU在單位時(shí)間內(nèi)處理多個(gè)任務(wù)的速度,自從有了核心數(shù)量這個(gè)概念,就一直受到了用戶們的關(guān)注。自雙核出現(xiàn)以來,CPU進(jìn)入了一個(gè)嶄新的時(shí)代,CPU處理速度大大提升是用戶們深有體會的。
而2005年以后,隨著雙核CPU越來越多地走進(jìn)人們視野,多核處理器技術(shù)也得到迅速發(fā)展。進(jìn)入2009年,CPU技術(shù)不斷發(fā)展,伴隨著價(jià)格的走低,多核處理器日漸發(fā)展成熟并趨于主流。四核CPU應(yīng)用也頻繁映入消費(fèi)者眼簾,在不經(jīng)意間,多核已經(jīng)來到了現(xiàn)實(shí)生活中。
在CPU生態(tài)系統(tǒng)中,處于不同生態(tài)環(huán)節(jié)的商家有著不同的觀點(diǎn),但總之,他們普遍認(rèn)為:四核CPU技術(shù)在今后一兩年為成為主流,并朝著多核的方向持續(xù)發(fā)展。
表1 供應(yīng)商對多核技術(shù)發(fā)展的觀點(diǎn)
英特爾中國服務(wù)器產(chǎn)品事業(yè)部產(chǎn)品經(jīng)理顧凡曾多次堅(jiān)持“多核CPU技術(shù)只是提供了硬件支持,企業(yè)的高性能計(jì)算或者超級計(jì)算應(yīng)當(dāng)回歸應(yīng)用本身”的觀點(diǎn),“雖然現(xiàn)在機(jī)器已經(jīng)達(dá)到千萬億次,但是要找到這么‘大’的應(yīng)用比制造機(jī)器更難。”
英特爾亞太客戶響應(yīng)團(tuán)隊(duì)技術(shù)經(jīng)理何萬青博士認(rèn)為,高性能計(jì)算的應(yīng)用主要是建立在軟件上,在3D CADCAE這塊中國幾乎是空白,軟件商的開發(fā)成本非常高,同時(shí)大型的CAE軟件經(jīng)過一代一代的演進(jìn)才很完善,中國要從頭開始,必須從零做起,還要去學(xué)會怎么保護(hù)知識產(chǎn)權(quán)。但毋庸置疑的是,英特爾會從源頭上提供技術(shù)支持,來滿足多核CPU技術(shù)所對應(yīng)的企業(yè)應(yīng)用。
而AMD大中華區(qū)計(jì)算產(chǎn)品部產(chǎn)品市場總監(jiān)唐志德則表示:“綜合來看,四核比雙核有60%以上性能的增加,在面對企業(yè)應(yīng)用等科學(xué)計(jì)算領(lǐng)域,四核有一個(gè)很好的提升。從我們美國首席技術(shù)官做的一個(gè)測評里看到,在仿真、模擬的應(yīng)用上,應(yīng)用四核CPU大概比單核節(jié)省70%的時(shí)間。”
用戶在逐漸認(rèn)可了雙核產(chǎn)品后,逐漸對核心有了明確的認(rèn)識,知道其作用與價(jià)值。得到認(rèn)可的廠商也開始認(rèn)識到巨大的市場正等待其占領(lǐng),于是不斷的推出高主頻、多核心的CPU產(chǎn)品,一次又一次的將CPU性能推到頂峰,從雙核到四核,CPU核心也經(jīng)歷了由有到多,由多到精的過程。
圖1 多核CPU下的異構(gòu)計(jì)算環(huán)境#p#page_title#e#
二 四核CPU漸入人心,已具備普及先決條件
據(jù)天極Datacenter八月份統(tǒng)計(jì)表明:8月四核CPU關(guān)注比例已經(jīng)超越雙核產(chǎn)品,關(guān)注比例為55.18%。而雙核產(chǎn)品本月成績?yōu)?6.13%。而三核CPU依然未能引起足夠關(guān)注,成績?yōu)?.69%。由此看出,用戶在8月開始更加留意四核CPU產(chǎn)品。四核產(chǎn)品對比雙核產(chǎn)品價(jià)格上當(dāng)然會昂貴許多,但正是因?yàn)槿绱?,更加證明了經(jīng)濟(jì)形勢有所好轉(zhuǎn),四核CPU的關(guān)注度和市場影響力逐漸提升。
圖2 2009年8月CPU核心數(shù)量關(guān)注比例
圖3 2009年8月CPU四核產(chǎn)品TOP10排行
四核CPU的速度是十分顯著的,一款高端四核CPU可以輕松的做到卡巴與360同時(shí)查殺,并在短時(shí)間內(nèi)完成任務(wù),其間用戶甚至可以一邊看電影或打游戲,聽歌等等,絕對不會出現(xiàn)滯留感。這就是多核心的獨(dú)特魅力。想象一下如果沒有這么多的CPU核心,用戶只能將上述任務(wù)分別進(jìn)行,那種等候的感覺,是十分令人焦躁的,既浪費(fèi)了時(shí)間,又讓心情跌至谷底。因此,四核CPU作為高端產(chǎn)品雖然價(jià)格昂貴,卻真正的使用戶體會到了暢快淋漓的速度。
總之,對于四核CPU的潛在市場需求,具有可觀的前景。也正如Intel所說:用戶需要的不是單一產(chǎn)品,而是整體解決方案,因此系統(tǒng)集成商有許多工作需要做。這期間包括了3D CAD和CAE軟件提供商,在它們的軟件開發(fā)和更新過程中,結(jié)合多核CPU技術(shù)的發(fā)展,為企業(yè)用戶更高效地應(yīng)用這些軟件打下基礎(chǔ)。#p#page_title#e#
第二部分:四核CPU在3D CAD、CAE中的應(yīng)用分析
作為主要為企業(yè)級應(yīng)用服務(wù)的3D CAD和CAE軟件產(chǎn)品,究竟會隨著多核CPU的革新帶來多大的效率提升,很多企業(yè)對此還比較未知。
企業(yè)購買強(qiáng)大的硬件產(chǎn)品,歸根到底是為了更好的應(yīng)用軟件。具體到制造企業(yè)就是更好的應(yīng)用CAD、CAE等涉及到大量運(yùn)算、對CPU和內(nèi)存要求較高的軟件產(chǎn)品。而事實(shí)上一款軟件能否充分發(fā)揮出硬件性能,中間涉及到很多因素,諸如:
- 3D CAD、CAE軟件的運(yùn)行效率與CPU、內(nèi)存、顯卡以及操作系統(tǒng)的關(guān)系;
- 3D CAD、CAE軟件本身是否進(jìn)行了針對四核CPU的優(yōu)化?都能在支持四核CPU的操作系統(tǒng)上運(yùn)行?
正如好馬還需配好鞍,對于希望通過添置四核工作站來提升CAD、CAE軟件的應(yīng)用效率的制造業(yè)企業(yè)來說,亟需解決上述幾個(gè)問題。而帶著這樣的問題,e-works充分采訪調(diào)研了目前市場主流的3D CAD和CAE軟件供應(yīng)商,從各種軟件本身來探討對于多核CPU技術(shù)的支持。
圖5 Windows平臺下16核CPU同時(shí)工作的任務(wù)管理器狀態(tài)
一 四核CPU在3D CAD中的應(yīng)用普及為時(shí)尚遠(yuǎn)
對于企業(yè)級用戶來說,用3D CAD進(jìn)行產(chǎn)品設(shè)計(jì),多核CPU還處于推介普及階段,目前的大多數(shù)企業(yè)在進(jìn)行三維設(shè)計(jì)時(shí),還在使用雙核處理器的圖形工作站,甚至配置更低的PC。
1 多數(shù)3D CAD軟件已兼容多核CPU技術(shù)
2005年后,雙核CPU的逐漸普及,眾多的3D CAD供應(yīng)商在進(jìn)行新版本研發(fā)時(shí),就已經(jīng)開始優(yōu)化軟件架構(gòu),以兼容多核CPU技術(shù),更大程度的提升軟件運(yùn)行效率。從調(diào)研的主流3D CAD軟件廠商來看,絕大多數(shù)已經(jīng)支持四核CPU技術(shù)。
表2 主流3D CAD對四核CPU的支持情況
對于國際市場主流的3D CAD產(chǎn)品,譬如Solidworks,從Solidworks2008版本開始就支持四核CPU技術(shù)了。SolidWorks一級代理商北京盛維工程師介紹說:基于Windows平臺開發(fā)的Solidworks,完全融入了Windows的操作習(xí)慣,從面向桌面的搜索,到基于VBC++語言的二次開發(fā),甚至連CTRL+C、CTRL+V的習(xí)慣都延用下來了。所以在SolidWorks2008版本以后的軟件,也完全可以基于四核CPU來進(jìn)行運(yùn)行,特別是對于大裝配體的設(shè)計(jì),效率提升非常明顯。
SolidEdge產(chǎn)品經(jīng)理雷俊雄說:如果只是進(jìn)行簡單的設(shè)計(jì)工作, 幾乎所有的3D CAD軟件對硬件的要求都不高(如圖6所示)。但要想三維設(shè)計(jì)時(shí)計(jì)算機(jī)運(yùn)行地足夠流暢,就得使用盡量高配的計(jì)算機(jī)。
圖6 3D CAD、CAE軟件最低推薦配置
對于PROE來說,盡管也支持多核CPU,但在進(jìn)行三維繪圖和工業(yè)設(shè)計(jì)的過程中,多數(shù)企業(yè)還是使用雙核CPU的PC,如要要用到PROE里的Mechanica分析模塊,才有可能用高配置的計(jì)算機(jī),調(diào)用多CPU進(jìn)行運(yùn)算。
圖7 PROE硬件配置需求單
2 企業(yè)硬件更新落后于硬件技術(shù)發(fā)展
盡管目前主流的3D CAD軟件基本上支持4核CPU技術(shù),企業(yè)的設(shè)計(jì)工程師們也認(rèn)識到多核CPU技術(shù)可以很大程度地提高設(shè)計(jì)效率,但4核CPU在企業(yè)的普及使用程度卻并不樂觀。
四機(jī)塞瓦的CAD工程師熊剛說:“硬件技術(shù)更新太快,現(xiàn)在換了更好的計(jì)算機(jī),過了半年或者一年還是淘汰了。而目前的計(jì)算機(jī)也能運(yùn)行基本的操作,盡管效率上有待提升,但企業(yè)本著控制成本的原則,對升級硬件還是持觀望態(tài)度”。熊剛的這種解釋基本也代表了目前制造業(yè)企業(yè)里普遍存在這樣一種觀點(diǎn)。
另外,如NX、CATIA、SolidEdge、Inventor等主流3D CAD,也都處于這樣的狀況。另一位制造企業(yè)的工程師則這樣評述CPU、內(nèi)存和顯卡之間的關(guān)系:“在進(jìn)行三維設(shè)計(jì)時(shí),cpu決定了處理速度,內(nèi)存決定了運(yùn)行速度,顯卡決定了顯示效果,顯示流暢才是真的流暢。”
蘇州江南嘉捷電梯股份有限公司的設(shè)計(jì)工程師丁建新介紹:在日常的設(shè)計(jì)工作中,工程師們都用常規(guī)的臺式機(jī),涉及到較為復(fù)雜的裝配,設(shè)計(jì)部門有一臺專用的四核圖形工作站,以備用。#p#page_title#e#
二 多核CPU在CAE的應(yīng)用呈兩極分化趨勢
對于企業(yè)的CAE用戶來說,目前處于兩級分化狀態(tài):一方面,對于簡單的分析工作,用圖形工作站也勉強(qiáng)可以運(yùn)行,即使效率并不高,但大多數(shù)企業(yè)認(rèn)為只要能夠得出結(jié)果,就可以接受;另一方面,真正涉及到復(fù)雜的分析、仿真工作,對于具有獨(dú)立CAE研究院所或者CAE中心的企業(yè)來說,僅僅用四核CPU來運(yùn)算,仍顯不夠,他們往往采用集群式HPC來完成。所以,四核CPU在CAE用戶中的普及程度,依然不夠廣泛。
1 簡單分析工作仍使用圖形工作站
伴隨著硬件技術(shù)的發(fā)展,CAE軟件要不停的開發(fā)和更新,滿足特定的功能指標(biāo),進(jìn)行相應(yīng)的優(yōu)化設(shè)置,才能充分發(fā)揮硬件的能力。例如,一個(gè)軟件不能支持并行計(jì)算(SMP or MPP),就無法同時(shí)使用多核并行求解,也就無法充分發(fā)揮多核心多CPU的作用。
與3D CAD軟件不同的是,市場上主流的CAE軟件基本都具備并行版本,因此對多核處理器的支持也更加的順其自然。
表3 主流CAE軟件對多核CPU的支持情況
經(jīng)緯紡機(jī)的CAE室主任(原CAD室主任)張心忠在介紹他們企業(yè)的情況時(shí)說:CAD室主要用的是PROE和SolidWorks,CAE用的是PROE的Mechanica模塊和MSC.ADAMS。因?yàn)槭欠珠_配置的電腦,所以配置并不相同。對于PROE來說,對硬件的配置比較高。需要用到2G以上的雙核CPU。而Solidworks對硬件要求相對較低。在進(jìn)行多體動力學(xué)仿真時(shí),往往將PROE的模型導(dǎo)入至Adams中,這時(shí)候往往導(dǎo)入簡化模型,反而沒有在PROE中的模型大,所以對硬件的配置反而較低。
對于諸如經(jīng)緯紡機(jī)、嘉捷電梯此類的企業(yè)來說,分析工作較為簡單,雖說可以使用四核CPU技術(shù)來提升仿真分析效率,但普通的工作站也基本能勝任。因此也呈現(xiàn)了諸多企業(yè)在做簡單分析工作仍由圖形工作站的現(xiàn)狀。
2 專業(yè)CAE分析采用高性能計(jì)算機(jī)集群
而另一方面,對于大型的有限元、前后處理、優(yōu)化等專業(yè)計(jì)算,我國制造業(yè)表現(xiàn)得并不落后,在很多整車、整機(jī)廠,都配有獨(dú)立的CAE研究所或CAE研究中心,采用高性能計(jì)算機(jī)集群進(jìn)行計(jì)算工作。
正因?yàn)槿绱?,多核CPU技術(shù)在這些計(jì)算機(jī)集群中就利用地淋漓盡致。從4核到64核,所得到的效率提升也非常明顯。
西安超算所的一位工程師介紹說:有限元作為一種分析方法,可以用在力學(xué)、流體等多種物理量的分析。在常用CAE軟件中,做網(wǎng)格劃分一般都是串行任務(wù),使用CAE的串行版就足夠,因此只需要用單核CPU。而對于優(yōu)化、前后處理等環(huán)節(jié),使用并行版CAE軟件,可以極大提升效率。
圖8 Abaqus計(jì)算相同自由度模型64核CPU比4核CPU效率提升92%
達(dá)索系統(tǒng)Simulia工程師孟龍博士在介紹Abaqus在應(yīng)用多核CPU說:“目前Abaqus的并行版最多已經(jīng)可以支撐512個(gè)計(jì)算核心。每增加一倍的CPU核數(shù),運(yùn)行效率就得到一定的提升,但因?yàn)樯婕熬€程的沖突、多任務(wù)的排隊(duì)等待,造成并不是成倍數(shù)的增加。比如說四核CPU的運(yùn)算效率是單核的三倍多,64核CPU的運(yùn)算效率只是4核CPU10倍多。另外,采用多核CPU與模型的自由度也有很大關(guān)系。”
圖9 在Windows Server2003下運(yùn)行Simulia,不同核數(shù)CPU對應(yīng)的時(shí)間關(guān)系
賽特達(dá)的賴宇陽先生說:譬如優(yōu)化計(jì)算和數(shù)據(jù)處理軟件Isight,它在優(yōu)化計(jì)算和數(shù)據(jù)處理方面對內(nèi)存、CPU有較高要求但是跟CAD/CAE軟件相比,顯卡資源占用不高。Isight對雙核CPU, 64bit操作系統(tǒng)進(jìn)行過優(yōu)化,提高數(shù)據(jù)處理性能和并行計(jì)算能力。主要是針對并行計(jì)算、網(wǎng)格計(jì)算方面,發(fā)揮硬件的計(jì)算潛力。
而作為平臺級仿真解決方案的軟件來說,譬如比利時(shí)LMS公司的工程師唐昊介紹說:Virtual.lab 和Imagine.lab 本身對硬件沒有什么要求。由于使用virtual.lab往往涉及到大型有限元的計(jì)算,內(nèi)存大小和cpu處理速度往往決定了求解的速度。特別值得一提的是:有限元分析軟件的計(jì)算速度提升非常依賴大內(nèi)存的支持,只有內(nèi)存足夠大,才能把所有數(shù)據(jù)一次放進(jìn)內(nèi)存,才能最快對數(shù)據(jù)計(jì)算和得到結(jié)果,否則當(dāng)物理內(nèi)存不足的時(shí)候,系統(tǒng)就會使用虛擬內(nèi)存(磁盤部分作為虛擬內(nèi)存),這樣降大大降低性能。CAE計(jì)算在初始化、中間結(jié)果保存和計(jì)算結(jié)果輸出時(shí)都會有密集的數(shù)據(jù)IO操作,而且目前并行計(jì)算程序的IO操作大多還是串行進(jìn)行的,因此IO的性能經(jīng)常是并行計(jì)算程序的瓶頸所在。通過RAID進(jìn)一步提升讀取速度,通過多塊磁盤RAID,磁盤的IO速度可以成倍提高。
根據(jù)問題不同而定。Virtual.lab和imagine.lab均支持多種并行方式,并且支持64位系統(tǒng)和硬件。理論上可以調(diào)用任意多的內(nèi)存和cpu以加快計(jì)算速度。Virtual.Lab完全支持四核CPU,并能實(shí)現(xiàn)多種并行方式(分域并行,分頻并行)。
3 運(yùn)用多核CPU進(jìn)行CAE分析的挑戰(zhàn)
Altair的技術(shù)支持經(jīng)理洪清泉先生在解釋Hyperworks進(jìn)行多核CPU運(yùn)算時(shí)介紹:HyperWorks圖形界面類模塊的性能主要跟顯卡有關(guān),處理大模型(100萬單元以上)和超大模型(1000萬單元以上)時(shí),為了獲得流暢的顯示效果,需要性能良好的顯卡,經(jīng)過大量的測試和優(yōu)化,可以為客戶提供顯卡推薦配置。對于求解器類模塊,主要是進(jìn)行數(shù)值計(jì)算,不涉及到實(shí)時(shí)的圖形顯示與處理,所以并不需要有專業(yè)的顯卡,而主要對CPU速度、多核數(shù)目、內(nèi)存帶寬、硬盤速度等有關(guān)系。
另外,洪清泉也表示:同一CAE軟件下的不同功能模塊,對硬件的要求也不一致,譬如以HyperWorks中的HyperMesh,Radioss和OptiStruct為例:HyperMesh具有極好的圖形驅(qū)動和利用能力,200萬單元的模型在普通顯卡如Quadro FX 570(512M顯存)上即可以非常流暢的操作和顯示;Radioss顯式并行計(jì)算具有業(yè)界最佳的多核加速比,計(jì)算速度與CPU核數(shù)呈良好的線性關(guān)系;OptiStruct優(yōu)化計(jì)算具有極佳的內(nèi)存利用效率,在普通2G內(nèi)存的機(jī)器上即可求解超過20萬個(gè)變量的多約束多工況優(yōu)化問題,4G內(nèi)存以上的機(jī)器可以處理超過50萬個(gè)變量的優(yōu)化問題。
而CDAJ的工程師則說:對于一維分析軟件GT-SUITE因?yàn)橛?jì)算量不是很大,對計(jì)算機(jī)的要求不是很高。
而對于計(jì)算流體動力學(xué)(CFD)分析來說,隨著計(jì)算模型的復(fù)雜程度,所需要的硬件配置肯定也會有所提高。以一個(gè)工程應(yīng)用中常見的規(guī)模在100~200萬Polyhedral(多面體)網(wǎng)格的計(jì)算模型來說,推薦至少配備4GB的物理內(nèi)存,顯存128MB的Nvidia Quadro FX系列顯卡,主頻在2GHz以上的Intel酷睿系列或至強(qiáng)Xeon處理器。其中,對內(nèi)存和顯存的要求比較嚴(yán)格,如果物理內(nèi)存不足,在網(wǎng)格生成或者求解計(jì)算時(shí)需要調(diào)用虛擬內(nèi)存的話,工作效率就會大大降低;而顯存不足會影響到計(jì)算模型的網(wǎng)格顯示及結(jié)果后處理,易造成顯示速度慢、模型無法拖動查看等問題。而CPU的內(nèi)核數(shù)、主頻、二級緩存等因素主要影響到計(jì)算速度的快慢,這就依據(jù)實(shí)際項(xiàng)目可以承受的計(jì)算時(shí)間而定。
以CFD軟件STAR-CD為例,下圖是一個(gè)并行計(jì)算的測試圖,測試模型是一個(gè)網(wǎng)格數(shù)目為600萬的汽車外流分析。使用4個(gè)node,單個(gè)node的配置都是2個(gè)4核的CPU。所對比的并行測試網(wǎng)絡(luò)環(huán)境分別為千兆以太網(wǎng)和InfiniBand。從測試圖中的計(jì)算時(shí)間來看,使用4核CPU工作時(shí),其計(jì)算效率約是使用雙核CPU時(shí)的1.8倍,是使用單核CPU時(shí)的3.5倍。
此外,從測試圖中還可以看到,不同的網(wǎng)絡(luò)環(huán)境對并行計(jì)算效率的提升也有著很大的影響。
圖10 STAR-CD V4并行性能比較
在眾多的CAE軟件新版本中,對多核技術(shù)進(jìn)行優(yōu)化的也不在少數(shù)。譬如在最新的HyperWorks10.0中的求解器類應(yīng)用程序?qū)iT針對多核進(jìn)行優(yōu)化,例如:RADIOSS顯式并行求解會盡量將相鄰的domains(Radioss獨(dú)有的對大模型進(jìn)行分區(qū)并指定不同求解設(shè)置的技術(shù))分配到同一個(gè)CPU上,減少機(jī)器和機(jī)器之間的通訊量,充分利用本機(jī)上的多核資源;Radioss隱式線性多工況求解速度在多核機(jī)器上大幅度提高,對于四核機(jī)器,速度比單核最快可提高達(dá)3.8倍,對于8核機(jī)器,速度比單核最快可提高達(dá)7倍。此外,OptiStruc優(yōu)化求解過程中的靈敏度計(jì)算也針對多核機(jī)器進(jìn)行了優(yōu)化。
對于圖形類應(yīng)用,用戶從多核心技術(shù)上得到好處相對有限,主要是因?yàn)闃I(yè)界主流的圖形引擎OpenGL尚未完全對多核進(jìn)行改寫。當(dāng)然,用戶還是可以從多核技術(shù)上得到好處,例如可以同時(shí)開啟多個(gè)HyperMesh而不會出現(xiàn)單核心時(shí)機(jī)器響應(yīng)速度慢的問題。#p#page_title#e#
1 顯卡與運(yùn)算效率的關(guān)系
無容置疑,在相同核數(shù)CPU的前提下,顯卡對各種3D CADCAE軟件的效率起著非常重要的作用。那么,顯卡對多核CPU運(yùn)算效率起著怎么樣的影響呢?
首先,在3D CAD軟件中,以Inventor為例,模型的渲染與顯卡有著密不可分的關(guān)系。專業(yè)和非專業(yè)顯卡的區(qū)別在于在制作模型的視圖中賦予物體反射或折射等的材質(zhì)后可以在平滑+高光的情況下看出一些簡單的反射折射效果。
而在PROE和Solidworks中,相對顯卡的依賴要小,而以曲面功能見長的CATIA和NX,在進(jìn)行大裝配體操作和渲染工作的時(shí)候,也表現(xiàn)出來了對專業(yè)顯卡的依賴。
圖11 專業(yè)和非專業(yè)顯卡渲染的發(fā)動機(jī)效果
在專業(yè)圖形顯示領(lǐng)域,NVIDIA提出了GPU(圖形處理器)的概念,以專門的圖形處理芯片完成圖形顯示部分,從而減小對CPU的依賴。雖然NVIDIA公司在1999年發(fā)布GeForce 256圖形處理芯片時(shí)就提出GPU的概念,但很長一段時(shí)間用在游戲、傳媒娛樂業(yè),關(guān)于GPU在3D CADCAE等數(shù)值計(jì)算中的運(yùn)用,其發(fā)展比多核心CPU技術(shù)更晚,目前還是起步階段。
CPU比較擅長數(shù)值計(jì)算,而GPU擅長浮點(diǎn)計(jì)算。 盡管有一些特定用途的軟件已經(jīng)可以利用GPU進(jìn)行數(shù)值計(jì)算,而且也達(dá)到相當(dāng)好的速度提升,但是CAE軟件并不是完全純數(shù)值計(jì)算,還有相當(dāng)部分的邏輯判斷,而這并不是GPU的強(qiáng)項(xiàng)。如果是對浮點(diǎn)運(yùn)算要求較高的計(jì)算項(xiàng)目,GPU則可以發(fā)揮其最大的作用,提高計(jì)算效率。此外,CAE軟件還需要針對不同平臺,如Linux,IBM AIX,HP UX等進(jìn)行專門的性能優(yōu)化,對內(nèi)存和硬盤的帶寬進(jìn)行有效的利用,才能充分發(fā)揮計(jì)算機(jī)硬件的能力。
2 軟件版本與運(yùn)算效率的關(guān)系
此外,在不同核數(shù)CPU下,軟件版本的高低也對運(yùn)算效率有所影響。以Fluent為例,在相同的操作系統(tǒng)下,分別采用不同CPU核數(shù)進(jìn)行運(yùn)算,最終的結(jié)果顯示,較新的軟件版本比舊版本的運(yùn)算效率高。(如圖12所示)
圖12 版本軟件在不同CPU核數(shù)下對運(yùn)算效率的影響
3 操作系統(tǒng)與運(yùn)算效率的關(guān)系
在采用不同核數(shù)的CPU進(jìn)行CAE大型運(yùn)算時(shí),除了上述因素之外,操作系統(tǒng)對CAE運(yùn)算效率也有著細(xì)微的影響。對于超大規(guī)模的集群式CAE運(yùn)算來說,因?yàn)長inux操作系統(tǒng)的低成本、低系統(tǒng)資源占有率和高可擴(kuò)展性,讓大多數(shù)CAE用戶都沿用了Linux操作系統(tǒng),盡管從雙核一直到64核,Windows操作系統(tǒng)相比Linux操作系統(tǒng)的效率有著微小的差距,但隨著核數(shù)的增加,這種差距越來越小,而更多地與軟件模型、自由度以及硬件配置相關(guān)。在某種特殊的測試場合,在Fluent中通過64核進(jìn)行計(jì)算,甚至Windows操作系統(tǒng)效率要高于Linux操作系統(tǒng)。
圖13 操作系統(tǒng)在不同CPU核數(shù)下對運(yùn)算效率的影響
另外,隨著操作系統(tǒng)的升級,本身也會帶來運(yùn)算效率的提升。譬如微軟的Windows Compute Cluster Server 2003在運(yùn)行Fluent時(shí),通過增加CPU核數(shù)提升的效率(黃線所示)是一條斜率逐漸減少的線,而Fluent在Windows HPC Server 2008上運(yùn)行的時(shí)候,通過增加CPU核數(shù)提升的效率(紅線所示)則接近一條斜率一致的直線。由此可見,通過增加CPU核數(shù)提升計(jì)算效率也受到操作系統(tǒng)的影響。
圖14 不同操作系統(tǒng)版本對運(yùn)算效率的影響
但總的來說,操作系統(tǒng)與CAE運(yùn)算效率的關(guān)系比較小,更多的取決于軟件模型、自由度、硬件配置等。#p#page_title#e#
第三部分 四核CPU技術(shù)在制造企業(yè)的拓展應(yīng)用
因?yàn)榉N種原因,四核CPU技術(shù)在現(xiàn)階段并沒有如同雙核誕生之時(shí)那般地發(fā)展迅速,對于看重實(shí)際效用的制造企業(yè)來說,只有物超所值的時(shí)候,他們才會購買。但其實(shí),除了真正意思上購買多核CPU來升級企業(yè)的硬件,還有許多其他的應(yīng)用模式,同樣可以為企業(yè)帶來價(jià)值。
在此也探討一下多核CPU技術(shù)在制造企業(yè)的拓展應(yīng)用。
1 多圖形工作站搭建“HPC集群”
首先,對于具備CAD設(shè)計(jì)室或CAE研究室的企業(yè)來說,通常會有數(shù)臺圖形工作站或者一般性能的PC。對于這些工作組級的PC,微軟新推出的Windows HPC 2008操作系統(tǒng),提供了一種將它們并行起來的方式:白天,不同的工程師們?nèi)匀豢梢园凑諔T例使用自己的電腦進(jìn)行各自設(shè)計(jì)、分析工作;晚上,通過圖形工作站上的Windows HPC 2008操作系統(tǒng)實(shí)現(xiàn)鏈接,組成一個(gè)小型的拓?fù)渚W(wǎng)絡(luò),計(jì)算某些需要高性能服務(wù)器才能完成的工作。(如圖15所示)
圖15 多圖形工作站構(gòu)建的HPC集群
簡單來說,這是一種整合有限的計(jì)算資源、讓其發(fā)揮更大效用的一種方式,也是一種變相地實(shí)現(xiàn)多CPU運(yùn)算的方式。對于一些承擔(dān)不起高性能HPC集群或者并不常用到大型計(jì)算的企業(yè)來說,不失為一種省錢卻能解決問題的有效途徑。
如今,工程仿真問題可能涉及整個(gè)系統(tǒng),這意味著產(chǎn)品開發(fā)團(tuán)隊(duì)獲得更加詳細(xì)的幾何結(jié)構(gòu)和考慮所有CAD組件的時(shí)候,建立的模型會越來越大。此外,對復(fù)雜物理現(xiàn)象高保真再現(xiàn)——包括對湍流、空氣聲學(xué)、振動和多物理場的處理——也顯著提高了對工程仿真計(jì)算能力的要求。因此,HPC系統(tǒng)就顯得至關(guān)重要,它能夠提供建立大型模型時(shí)所需的能力,滿足工程決策時(shí)對開發(fā)時(shí)間提出的要求,在幾天甚至幾小時(shí)內(nèi)就能完成以前需數(shù)周甚至數(shù)月才能完成的任務(wù)。
當(dāng)然,通過多圖形工作站搭建的HPC集群,需要一種專用的高速低延遲網(wǎng)絡(luò),才能保證數(shù)臺計(jì)算機(jī)之間的數(shù)據(jù)暢通。這也是搭建HPC集群唯一也是較大的瓶頸。
2 發(fā)展中低端超算中心
除了搭建企業(yè)自己的HPC集群這種模式,很多中小型企業(yè)也可以通過租用計(jì)算平臺的方式來完成計(jì)算任務(wù),盡管企業(yè)自身沒有多核CPU平臺,卻可以享用到多核CPU帶來的效率提升。
比較典型的有上海超算中心,即使對于有獨(dú)立HPC服務(wù)器的大型企業(yè)來說,如果要完成超出企業(yè)自己HPC服務(wù)器所能及的工作任務(wù)時(shí),就必須租用功能更加強(qiáng)大的超算中心來完成了。但是,上海超算中心峰值速度超過10萬億次/秒的“曙光4000A”高性能計(jì)算機(jī),對于絕大多數(shù)的企業(yè)來說,并無用武之地,也著實(shí)不需要。所以,發(fā)展更多的中低端超算中心,提供給企業(yè)、研究所來處理大型計(jì)算工作,也不失為一種可行的方式。
其實(shí),在國內(nèi)已經(jīng)有類似先例,譬如西安超算所,作為西北地區(qū)一家專門從事高性能計(jì)算的單位,就提供TYAN的刀片集群及各種專業(yè)工作站、服務(wù)器,相比大型超算中心而言,TYAN的配置并不足以令人瞠目結(jié)舌,卻能運(yùn)行大多數(shù)計(jì)算項(xiàng)目。
據(jù)西安超算所的一個(gè)工程師介紹,他們在TYAN上配置了目前的絕大多數(shù)企業(yè)級大型通用有限元商業(yè)軟件,如:NASTRAN,ASKA,SAP,ANSYS,MARC,ABAQUS,JIFEX等等。這些軟件遍布機(jī)械制造、材料加工、航空航天、汽車、土木建筑、電子電器、國防軍工、船舶、鐵道、石化、能源等各個(gè)行業(yè)的應(yīng)用,因此也可以幫助企業(yè)完成一些大型的計(jì)算項(xiàng)目。
表4 TYAN FX71 刀片配置
3 構(gòu)建企業(yè)的“云計(jì)算”
從云計(jì)算概念推廣以來,雖然在其發(fā)展過程中有非常多的瓶頸和障礙,但不可否認(rèn)給企業(yè)級應(yīng)用提供了很多借鑒的方向。譬如,搭建大型集團(tuán)企業(yè)的“私有云”和工業(yè)園區(qū)的“公共云”。
中國很多軍工、航天航空、船舶制造業(yè),都以“集團(tuán)”的形式呈現(xiàn)。同一集團(tuán)的不同研究部門、研究院所,往往分開升級硬件配置或分別購買軟件產(chǎn)品,對于高端的軟硬件設(shè)備,實(shí)際的利用率并不高,這就造成了一定程度的資源浪費(fèi)。在云計(jì)算技術(shù)逐漸成熟的前提下,如果可以構(gòu)建集團(tuán)的“私有云”,在集團(tuán)范圍內(nèi)共享計(jì)算資源,不僅節(jié)省了資源,還可以在同等支出的情況下,購買更加高配置的硬件和軟件產(chǎn)品,滿足更多計(jì)算項(xiàng)目的需求。
另外,對于在中國不斷發(fā)展起來的工業(yè)園區(qū)(譬如:蘇州工業(yè)園、重慶永川工業(yè)園區(qū)、浙江嘉善姚莊工業(yè)園區(qū)、上海南匯工業(yè)園區(qū)等等),也可以建立園區(qū)內(nèi)的“公共云”,結(jié)合園區(qū)內(nèi)企業(yè)特點(diǎn),提供相應(yīng)的大型“云計(jì)算”平臺。
今年,安世亞太推出的“研發(fā)云計(jì)算”正是借鑒于此,目前已經(jīng)與合作伙伴策劃和搭建了有益于企業(yè)大型計(jì)算任務(wù)的“云計(jì)算”平臺。盡管這種模式只是一種狹義的“云計(jì)算”,卻為企業(yè)提供了一種應(yīng)用多核CPU技術(shù)的延伸模式。
諸如集團(tuán)企業(yè)的“私有云”和工業(yè)園區(qū)的“公共云”,還可以按行業(yè)劃分實(shí)現(xiàn)具有行業(yè)特色的“行業(yè)云”等等。
結(jié)語
綜合上述分析:企業(yè)一方面面對日趨復(fù)雜的產(chǎn)品設(shè)計(jì)及業(yè)務(wù)量的提升,導(dǎo)致數(shù)據(jù)量的處理日益龐大;另一方面軟件功能不斷升級,這就要求更高配的硬件平臺來支撐更加強(qiáng)大的功能;第三方面,四核CPU的價(jià)格逐漸走低,用戶的接納程度越來越高。
目前四核CPU的普及正經(jīng)歷著幾年前雙核CPU所走的路,盡管四核CPU在制造業(yè)企業(yè)3D CADCAE應(yīng)用中的普及過程更為緩慢,但毋庸置疑的是,四核CPU的應(yīng)用會隨著企業(yè)需求、價(jià)格拐點(diǎn)等因素逐漸普及。
作為不同解決方案的提供商來說,Intel也好、AMD也好,3D CADCAE軟件供應(yīng)商也好,要不斷地更新和豐富自身的技術(shù),以提供更加快速、高效的利器;而作為企業(yè)來說,更重要的是認(rèn)清這些技術(shù)給自己帶來的價(jià)值,當(dāng)這些技術(shù)的確可以為企業(yè)帶來物超所值的價(jià)值時(shí),企業(yè)就可以考慮“量入為出”的投入了,而不再是“超前消費(fèi)”。