Windows HPC Server 2008 部署初體驗
大家好,我是HPC中國研發(fā)團隊的新程序經(jīng)理(PM)實習(xí)生劉賢斐,聽言"PM是連接用戶和開發(fā)團隊的重要角色",因此,在加入微軟HPC組之后,盡快熟悉微軟HPC的產(chǎn)品成為我的重要任務(wù)之一,在在得到了包括老板George,育彤兄的大力支持以及天馳兄的大力PUSH之后,我成功地把Microsoft Windows HPC Server 2008(Beta1) 部署到了一臺具備一個頭節(jié)點4個計算節(jié)點的集群(Cluster)上。原來用HPC PACK部署集群是如此方便快捷(不是廣告,看后面就知道了),其興奮不言而喻,在此和大家分享一下我的經(jīng)歷。
那么什么是集群(Cluster)呢?比較正式的解釋是:集群(Cluster)是由兩臺或多臺節(jié)點機(服務(wù)器)構(gòu)成的一種松散耦合的計算節(jié)點集合,能夠為用戶提供各種服務(wù)。我們部署的集群外觀是這樣的:
HPC Server 2008的作用是在這上面部署操作系統(tǒng)以及集群管理工具等。先來說說HPC Server 2008的概念吧,它是由兩個部分組成的:Windows Server 2008和Microsoft HPC Pack。
Windows Server 2008主要是提供64位的操作系統(tǒng)支持,Microsoft HPC Pack提供了集群管理,任務(wù)調(diào)度,MPI編程環(huán)境,SDK等一系列工具。了解了概念后,就動手部署了,首先要做的是插好電源并檢查鼠標鍵盤以及網(wǎng)線有沒有接對(不是廢話,當(dāng)時我就沒注意分清CONSOLE的接口和頭節(jié)點的接口,慚愧慚愧),之后就在頭節(jié)點上裝好Windows Server 2008和HPC Pack。接下來當(dāng)我準備在四個節(jié)點上如法炮制時,立馬被無情地鄙視了,因為這是最低效率的做法了,我們要做的事情只是把四個節(jié)點的電源接通,然后利用HPC Pack的 Node Template(節(jié)點模板)功能就可以很方便地在所有的節(jié)點上搞定這些事情。具體的過程如下:進入Configuration后,你可以看到如下的界面:
首先,就是配置網(wǎng)絡(luò)(有5種網(wǎng)絡(luò)拓撲結(jié)構(gòu),具體的奧妙大家可以自己研究一把),配置系統(tǒng)帳號,給節(jié)點批量命名,最有意思的是第4步了,創(chuàng)建新的節(jié)點模板,如圖所示:
在向?qū)е猩宰髋渲茫宦?quot;Next",即大功告成。然后選擇在哪些節(jié)點上部署這個模板。我們支持對三種節(jié)點的部署:裸機節(jié)點,以前把其配置導(dǎo)出成XML文件的節(jié)點,和已經(jīng)安裝好操作系統(tǒng)的節(jié)點;對我來說在空節(jié)點上安裝當(dāng)然是第一種情形了,點擊"PROVISION", 部署就開始了?,F(xiàn)在可以在"Node Management"(節(jié)點管理)導(dǎo)航欄里面看到這些節(jié)點在"Provisioning"(正在部署)的列表中,單擊節(jié)點就可以看到它們部署的狀態(tài),在執(zhí)行哪些命令。
部署完畢后,就可以使用這些節(jié)點了,包括讓它們online或者offline,提交任務(wù)等。
HPC Server提供的一個很有意思的功能是查看節(jié)點的健康狀態(tài)(如下圖),我們可以選擇添加一些標準(Metric),添加之后,這些標準會以一個柱狀圖的形式顯示出來,顏色越深表示它的值越高。在我們的圖中可以看出來,頭結(jié)點(TYANHEAD)上的每秒系統(tǒng)調(diào)用數(shù)量(System Calls/ Second)和硬盤的吞吐量(Disk Throughput)都比其他節(jié)點高,所以它們對應(yīng)的顏色也越深,而頭結(jié)點可用的物理內(nèi)存(Available Physical Memory)最少,所以相對于其他節(jié)點來說,它的顏色也教淺。這樣可以讓管理員直觀的看到現(xiàn)在每個節(jié)點的狀態(tài)。
怎么樣,是不是很方便啊,沒有繁瑣的步驟,不用記大量的命令,一切都很一目了然就可以部署集群了。
以上是我的一些體驗,歡迎大家指出不當(dāng)之處,多多交流~, 同時也感謝全體HPC 中國研發(fā)團隊對我撰寫此文的幫助。
原文鏈接:http://windowshpc.net/Blogs/China/Lists/Posts/Post.aspx?ID=6