為HPC Server 2008選擇合適的網(wǎng)絡(luò)拓撲
眾所周知,配置集群的網(wǎng)絡(luò)通常是一件令人頭疼但卻又無法逃避的復(fù)雜工作。為了簡化這項工作,Windows HPC Server 2008提供了一個向?qū)В∟etwork Wizard)來幫助我們完成網(wǎng)絡(luò)的配置,如下圖所示。
在上圖中我們可以看到,Windows HPC Server 2008支持五種不同的網(wǎng)絡(luò)拓撲結(jié)構(gòu)。那么我們應(yīng)該如何去選擇一個合適自身情況的拓撲呢?且聽本文慢慢道來。
首先,讓我們來了解一下各種拓撲結(jié)構(gòu)中涉及到的三種網(wǎng)絡(luò):
Enterprise網(wǎng)絡(luò)(企業(yè)網(wǎng)絡(luò),在Beta 1中稱為Public網(wǎng)絡(luò))
不僅集群中的節(jié)點可能連接到這個網(wǎng)絡(luò),企業(yè)或機構(gòu)中的其他計算機通常也連接到這個網(wǎng)絡(luò)。大多數(shù)用戶通過這個網(wǎng)絡(luò)來進行通訊,進行他們的日常工作。
Private網(wǎng)絡(luò)(私有網(wǎng)絡(luò))
這是集群的內(nèi)部網(wǎng)絡(luò),它可以用來承載集群內(nèi)部節(jié)點間的通訊,集群外部的計算機通常無法連接到這個網(wǎng)絡(luò)。
Application網(wǎng)絡(luò)(應(yīng)用網(wǎng)絡(luò),在Beta 1中稱為MPI網(wǎng)絡(luò))
這是一個集群內(nèi)部的高速網(wǎng)絡(luò),通常具有很高的帶寬和很低的延遲,可以用來滿足集群內(nèi)部并行MPI程序的通訊需求。常見的高速網(wǎng)絡(luò)有Gigabit Ethernet、10 Gigabit Ethernet、Myrinet?、InfiniBand?等等。
Windows HPC Server所支持的五種拓撲結(jié)構(gòu)的區(qū)別在于包含上述網(wǎng)絡(luò)中的不同子集,并且計算節(jié)點(Compute Node)能夠連接到的網(wǎng)絡(luò)有所不同。
拓撲1:集群有Enterprise和Private兩個網(wǎng)絡(luò),計算節(jié)點僅能連接到Private網(wǎng)絡(luò)。
拓撲2:集群有Enterprise和Private兩個網(wǎng)絡(luò),計算節(jié)點可以同時連接到這兩個網(wǎng)絡(luò)。
拓撲3:集群有Enterprise、Private和Application三個網(wǎng)絡(luò),但是計算節(jié)點只能連接到其中的Private和Application網(wǎng)絡(luò)。
拓撲4:集群有Enterprise、Private和Application三個網(wǎng)絡(luò),計算節(jié)點可以連接到所有這三個網(wǎng)絡(luò)。
拓撲5:集群只有Enterprise一個網(wǎng)絡(luò),所有節(jié)點均在這個網(wǎng)絡(luò)上。這是五種拓撲中最簡單的一種。
在這五個拓撲結(jié)構(gòu)中做出選擇之前,我們可能會需要考慮這樣一些因素:
是否想要利用Windows HPC Server 2008提供的一系列新的部署工具來部署集群中的節(jié)點?Windows HPC Server 2008利用Windows部署服務(wù)(Windows Deployment Service,簡稱WDS)來簡化部署集群節(jié)點的繁瑣工作,使得我們可以很方便的完成集群的部署(參見來看看我們的產(chǎn)品之Windows HPC Server 2008部署初體驗)。如果您想要使用這項便利的功能,那么拓撲5將不在您的選擇之列。
是否希望將集群內(nèi)部的通訊同企業(yè)或機構(gòu)內(nèi)的其他通訊分離開以獲得更平衡更好的網(wǎng)絡(luò)性能?如果沒有這種需求,可以考慮拓撲5,否則前四種拓撲會更為合適。
是否需要一個高速網(wǎng)絡(luò)來承載MPI并行程序的通訊需求以獲得更進一步的性能提升?如果您的答案是肯定的,拓撲3和拓撲4將會是最佳的選擇。如果所有的應(yīng)用程序都沒有基于MPI程序庫進行開發(fā),那么Application網(wǎng)絡(luò)就不是必須的,此時您可以考慮其他三種拓撲結(jié)構(gòu)。
計算節(jié)點是否需要大量的訪問位于Enterprise網(wǎng)絡(luò)或Internet上的資源?如果是的,我們建議您使用拓撲2、4或5。雖然在拓撲1和拓撲3中,計算節(jié)點可以通過頭節(jié)點(Head Node)上的NAT服務(wù)訪問外部網(wǎng)絡(luò),但是此時所有與外界的通訊都需要通過頭節(jié)點,頭節(jié)點可能會成為性能的瓶頸。
安全性與訪問方便性的平衡。拓撲1和拓撲3將集群內(nèi)部的通訊與外部的通訊分離開,集群外部無法直接訪問集群內(nèi)部的節(jié)點,提高了集群的安全性。其他三個拓撲則將所有節(jié)點直接連在Enterprise網(wǎng)絡(luò)上,使得在集群上開發(fā)和調(diào)試應(yīng)用程序變得容易。所以您將不得不在安全性與訪問方便性之間做出取舍。
我們可以將上述因素總結(jié)如下表:
怎么樣,現(xiàn)在是不是覺得很簡單地能夠在Windows HPC Server的五種網(wǎng)絡(luò)拓撲結(jié)構(gòu)中做出合適的選擇呢? #p#page_title#e#