推薦用于運行COMSOL Multiphysics的硬件配置
COMSOL Multiphysics® 求解的問題類型相當廣泛,加之當今軟件和硬件開發(fā)速度之快,并且不同價位的硬件有著很大的差異,因此,我們不能一概而論地說哪一款計算機對于所有使用案例來說都是最佳選擇。
內(nèi)存
對于計算機而言,最重要一個因素是,要有足夠的物理內(nèi)存 (RAM) 來求解您要處理的最大模型,并且您已正確安裝內(nèi)存。如果沒有足夠的內(nèi)存,那么無論您選擇什么樣的硬件,計算機的運行速度都會明顯下降。
您可以通過求解一些與待求解的最大模型相似但更小的模型來預測內(nèi)存需求,測試模型包含的物理場與您要在最大模型中求解的相同。監(jiān)視所用的內(nèi)存以及自由度,這些信息報告在“求解器日志”中。將曲線擬合為 A x (dof)^N 形式的表達式,其中 A 和 N 是擬合系數(shù),dof 是自由度數(shù),您可以據(jù)此預測較大模型的內(nèi)存要求。指數(shù) N 通常介于 1 到 2 之間,主要取決于所使用的線性方程組求解器的類型。因子 A 在很大程度上取決于待求解物理場的類型和各種物理場的組合,但也可能取決于模型中的具體特征。請注意,對于不同的模型類型,內(nèi)存使用率與自由度之間的關(guān)系存在巨大的差異,因此,您可能需要為待求解的每一種模型重復此過程。
您將需要一臺至少具有您估計的最大 RAM 容量的計算機。還請注意,如果內(nèi)存量遠遠超過實際需要的量,也并沒有什么明顯優(yōu)勢。請確保使用所選 CPU 支持的盡可能快的內(nèi)存速度。
性能在很大程度上還取決于內(nèi)存的安裝方式。計算機通過多通道內(nèi)存總線訪問安裝的內(nèi)存,如果內(nèi)存未正確填充,則內(nèi)存速度會降低。例如,假設有一臺具有四個內(nèi)存通道的單 CPU 計算機,每個通道有兩個插槽,總共有 8 個開放的 DIMM 插槽,如下圖所示。假設您希望安裝 64 GB 的 RAM,有多種方法可以做到這一點。
對于這臺計算機,在計算機性能方面的最佳做法是使用一個 8 GB DIMM 填充所有八個插槽。然而,這樣做的缺點是無法進行擴展,如果您需要升級 RAM,則需要購買所有新的內(nèi)存。近乎最佳的方法是為每個內(nèi)存通道放置一個 16 GB DIMM。性能可能略低于最佳配置,但通過再購買四個 16 GB DIMM,安裝的內(nèi)存可以增加一倍,因此這種配置總體上是最好的。純粹就可擴展性而言,最佳選擇是安裝單個 64 GB DIMM,因為這樣可以留下最多的空插槽。但是,這種情況下的性能可能會慢四倍左右,對于大內(nèi)存模型來說尤其如此。只有在首要考慮可擴展性的情況下,才建議使用這種配置。其他配置沒有任何優(yōu)勢。下面的示意圖對此進行了匯總。另外,與您的硬件供應商核實最佳內(nèi)存安裝問題也是不錯的做法。
影響軟件整體速度的其他因素
性能、CPU 類型、CPU 基頻、緩存、CPU 數(shù)量、每個 CPU 的內(nèi)核數(shù)和硬件成本之間存在著復雜的關(guān)系。COMSOL 代碼庫由多種不同的算法組成,這些算法具有不同的擴展屬性。因此,某些硬件因素對性能的影響大于其他因素,并且這些因素的相對優(yōu)點與問題的類型和大小都相關(guān)。所以,我們很難提出具體的硬件建議。下面給出一些一般建議。
CPU類型
不同的 CPU 架構(gòu)提供不同的特性集,其價格也存在顯著差異。
高端 CPU(如英特爾® 至強® Gold 和 Platinum 或者 AMD® EPYC®)處理器采用 CPU 到 CPU 互連技術(shù),使每臺計算機支持多個 CPU,并允許 CPU 之間相互通信,以訪問大量內(nèi)存。這些處理器具有最大內(nèi)存帶寬,能夠在內(nèi)存與處理器之間來回快速傳輸大量數(shù)據(jù),這是它們在運行 COMSOL 時的主要優(yōu)勢。高端 CPU 應在雙 CPU、甚至四 CPU 或八 CPU 配置中使用。如果您需要尋址大量內(nèi)存,或者計劃連續(xù)并行運行多個仿真,則此類 CPU 是最理想的選擇。在求解單個模型時,性能將隨著 CPU 數(shù)量的增加而提高,但相對性能的提高取決于模型的大小。在多 CPU 系統(tǒng)上求解較大模型時,速度提升更快。如果您計劃購買四 CPU 或八 CPU 系統(tǒng),請聯(lián)系 COMSOL 技術(shù)支持。
中端 CPU(如英特爾® 至強® W 或 AMD® Ryzen™ Threadripper™)處理器沒有 CPU 到 CPU 互連結(jié)構(gòu),因此對于單 CPU 計算機來說是不錯的選擇。它們具有與高端系統(tǒng)相當?shù)臅r鐘速度和內(nèi)核數(shù),是一種具有吸引力的全方位選擇。
英特爾® 酷睿™ 處理器等消費級 CPU 可以具有非常好甚至更加出色的性能,在求解較小內(nèi)存的模型時尤其如此。
時鐘頻率
較高的時鐘頻率通常會從軟件的各個方面提升性能速度。如果兩臺計算機的所有其他硬件規(guī)格都相同,則它們之間的相對性能主要取決于時鐘頻率。
高速緩存
高速緩存直接內(nèi)置在處理器中,緩存越大越好。在所有其他因素都相同的情況下,緩存較大的機器將表現(xiàn)出更好的性能。
內(nèi)核數(shù)
處理器中的內(nèi)核越多,一次可以執(zhí)行的并行線程就越多,這就是多線程處理。COMSOL 將自動利用所有可用的內(nèi)核,但這需要計算成本。并行使用過多內(nèi)核盡管通常只用于求解相對較小的模型,但這樣做可能會導致速度降低,有些模型甚至被它們的單線程性能控制。一般來說,六核或八核系統(tǒng)是比較好的全方位選擇,但內(nèi)核越多可能越好,這在并行運行多個模型或使用 PARDISO 直接求解器時尤其如此。
一般建議
參數(shù)化掃描
如果您打算在各個不同的模型中求解許多幾何變體、不同的網(wǎng)格、不同的材料集或其他參數(shù),就需要使用“參數(shù)化掃描”功能。舉例來說,如果您要掃描 10 種變化的零件尺寸,并掃描 10 種不同的材料和 10 個不同的模型參數(shù),則需要求解 1000 次相似的模型,在單臺計算機上將每次掃描作為單個作業(yè)運行時,求解時間(最壞的情況下)正好是原來的 1000 倍。
無論是在使用任何許可證類型的單臺計算機上,還是在使用網(wǎng)絡浮動許可證的集群計算機上,通過并行運行作業(yè)都可以減少掃描大量參數(shù)的求解時間。
為了在單臺計算機上并行求解,您可以使用批處理掃描功能。僅當內(nèi)存支持同時求解所有模型時,我們才建議您在單臺計算機上并行運行參數(shù)化掃描。例如,如果求解一個模型實例需要 3GB 內(nèi)存,那么就可以在 16GB 內(nèi)存的計算機上同時運行四個作業(yè)。對于內(nèi)存要求較少的模型,在同時運行與內(nèi)核數(shù)一樣多的作業(yè)時,性能有明顯的提升。使用“批處理掃描”時的相對加速比取決于模型和硬件。
為了在集群上并行求解“參數(shù)化掃描”,您可以使用集群掃描功能。一次可以運行的并行作業(yè)數(shù)沒有限制(最多可以達到集群上可用節(jié)點的數(shù)量)。您可以在自己的集群上運行,也可以使用第三方集群運行。COMSOL 維護著一個技術(shù)合作伙伴列表,這些合作伙伴為集群計算提供隨需應變的計算資源。每個集群節(jié)點只需滿足針對運行單個模型所設定的要求即可。有關(guān)集群硬件的進一步指導信息,請參見知識庫 1116。
另請參見知識庫 1250:從命令行運行參數(shù)化掃描、批處理掃描和集群掃描。
您應該始終考慮是否可以使用優(yōu)化模塊來避免大規(guī)模掃描。
操作系統(tǒng)
在 COMSOL Multiphysics 5.4 之前的版本中,Linux 和 macOS 操作系統(tǒng)在某些多核處理器上的性能表現(xiàn)可能超過 Windows。
硬盤驅(qū)動器
與硬盤驅(qū)動器相比,固態(tài)硬盤可以提供更好的整體系統(tǒng)性能。驅(qū)動器的速度總是越快越好,但如果系統(tǒng)在您求解的模型上將驅(qū)動器用于交換空間(虛擬內(nèi)存),則最好升級內(nèi)存,而不是投資到提升驅(qū)動器的速度上。
顯卡
我們推薦使用基于最新 AMD 或 NVIDIA 的專用顯卡。您可以在系統(tǒng)要求頁面找到通過測試的顯卡列表。顯卡的內(nèi)存越大,您能看到的模型細節(jié)越復雜。請注意,不能僅僅因為求解模型需要大量的 RAM 內(nèi)存就斷定需要較大視頻卡才能顯示模型,反之亦然。
GPU
本軟件目前不支持圖形處理單元上的通用計算。