世界第一臺電動跑車設(shè)計平臺-XASUN視覺計算工作站
美國著名電動汽車制造商Tesla Motors 采用 The MathWorks 的基于模型的設(shè)計工具,以開發(fā) 2008 款 Tesla Roadster,它是世界第一輛電動跑車
為了在有限的預(yù)算和時間內(nèi)滿足苛刻的技術(shù)目標(biāo),Tesla Motors 設(shè)計團隊依靠 Simulink 和 MATLAB 對整個汽車和其主要子系統(tǒng)建模。工程師將汽車每個主要系統(tǒng)獨立的模型(包括電動機、電池、傳動機構(gòu)、制動器、輪胎、電力以及控制系統(tǒng))集成到一個完整的系統(tǒng)模型中。他們在構(gòu)建樣機之前使用這些模型仿真計算和預(yù)測總體車輛性能,然后對比仿真結(jié)果和樣機路面測試結(jié)果,以改善整個系統(tǒng)模型。此方法縮短了總體設(shè)計和測試流程,并幫助 Tesla Motors 以遠(yuǎn)遠(yuǎn)低于傳統(tǒng)車輛的項目成本生產(chǎn) 2008 款 Tesla Roadster。
XASUN視覺計算工作站組成
Matlab數(shù)值計算都是基于CPU為核心,將密集數(shù)值計算和復(fù)雜圖形圖像處理交給超級計算機甚至大型并行計算集群系統(tǒng)完成,今天我們推薦這套個人超級圖形計算平臺,借助GPU超強的浮點運算能力,大幅提升并行計算能力和實時仿真系統(tǒng)處理速度,這套成本僅僅最低不到5萬元人民幣,但它已經(jīng)超過傳統(tǒng)的30萬集群的性能
一臺典型專業(yè)圖形工作站,安裝上Tesla C1060高性能計算卡和Jacket Engine引擎就成為一臺Matlab個人超級圖形計算機了
產(chǎn)品型號 XASUN GPU T12308TT
參考配置:
1. 工作站硬件配置 | |||
分類 | 配件型號規(guī)格 | 數(shù)量 | 備注 |
CPU | AMD Phenom 9650 | 1 | |
主板 | Foxconn A79-S | 1 | |
內(nèi)存 | 2GB DDR800 | 4 | |
顯卡 | 麗臺Quadro FX570 256MB | 1 | |
GPU處理器 | Tesla C1060 240核/4GB顯存 | 1 | |
硬盤 | ST 500G SATA企業(yè)級 | 1 | |
光驅(qū) | DVD-RW | 1 | |
機箱 | XASUN TC-SS-KL03 | 1 | |
電源 | 1000W EPS | 1 | |
2. GPU計算引擎 | |||
Jacket Engine For Matlab | 1 | ||
3. 其他 | |||
數(shù)值計算系統(tǒng) |
Simulink 和 Matlab 可選 | ||
操作系統(tǒng) | Windows 或 Linux 64位 可選 | ||
合計 | 45000元 |
下面我們主要介紹:
1. Nvidia Tesla C1060高性能計算卡
2.Jacket Engine for Matlab引擎
一. Tesla C1060卡 –超過10臺頂級雙路Xeon服務(wù)器性能
NVIDIA Tesla C1060 可將工程師桌邊圖形工作站轉(zhuǎn)變成一個性能遠(yuǎn)超小型集群的高性能計算機。它的計算能力甚至超過了一個小的計算機集群。與在數(shù)據(jù)中心中的共享計算機集群相比,NVIDIA Tesla C1060性能更強,消耗的能源更少。Tesla C1060基于大規(guī)模并行的多核Tesla處理器。
該處理器與標(biāo)準(zhǔn)的CUDA C語言編程環(huán)境緊密結(jié)合以簡化多核心編程,滿足HPC產(chǎn)業(yè)對性能無休止的追求,努力滿足對計算能力要求最苛刻的應(yīng)用的需求,這些應(yīng)用領(lǐng)域包括藥物研究、油氣開采以及計算金融。
多核心架構(gòu)在HPC高性能計算應(yīng)用中提供最理想的擴展能力。有些應(yīng)用程序的復(fù)雜性已經(jīng)超出了CPU的處理能力,Tesla多核架構(gòu)能滿足這些程序?qū)τ嬎隳芰Φ男枨蟆?br />
NVIDIA CUDA™ 技術(shù)充分發(fā)揮Tesla多核計算產(chǎn)品的性能。獨一無二的C語言環(huán)境,充分發(fā)揮GPU(圖形處理器)的多核處理能力,來解決世界上對計算能力要求最迫切的問題。
CUDA介紹:
CUDA是一種由NVIDIA推出的通用并行計算架構(gòu),該架構(gòu)使GPU能夠解決復(fù)雜的計算問題。 它包含了CUDA指令集架構(gòu)(ISA)以及GPU內(nèi)部的并行計算引擎。 開發(fā)人員現(xiàn)在可以使用C語言來為CUDA™架構(gòu)編寫程序,C語言是應(yīng)用最廣泛的一種高級編程語言。所編寫出的程序于是就可以在支持CUDA的處理器上以超高性能運行。 將來還會支持其它語言,包括FORTRAN以及C++。
目前,支持CUDA的GPU銷量已逾1億,數(shù)以千計的軟件開發(fā)人員正在使用免費的CUDA軟件開發(fā)工具來解決各種專業(yè)以及家用應(yīng)用程序中的問題。這些應(yīng)用程序從視頻與音頻處理和物理效果模擬到石油天然氣勘探、產(chǎn)品設(shè)計、醫(yī)學(xué)成像以及科學(xué)研究,涵蓋了各個領(lǐng)域。
技術(shù)特點:
用于GPU并行應(yīng)用開發(fā)的標(biāo)準(zhǔn)C語言
快速傅里葉轉(zhuǎn)換(FFT)以及基本線性代數(shù)子程序(BLAS)的標(biāo)準(zhǔn)數(shù)字庫
專用CUDA驅(qū)動器,用于GPU和CPU之間快速數(shù)據(jù)傳輸計算
CUDA驅(qū)動程序與OpenGL和DirectX圖形驅(qū)動程序可以實現(xiàn)互操作
支持Linux 32/64位,Windows XP 32/64位以及Mac 操作系統(tǒng)#p#page_title#e#
二、Jacket Engine for Matlab—把并行計算和圖形處理移到GPU平臺
1. Jacket Engine介紹
Jacket Engine 是專門MATLAB基于GPU計算引擎,由AccelerEyes公司開發(fā),其1.0版本已經(jīng)發(fā)布。AccelerEyes成立于2007年,致力于將GPU科技引入高性能計算(HPC)當(dāng)中,需要一個強勁的工具連接軟件開發(fā)人員和GPU硬件之間。當(dāng)硬件開發(fā)者致力于底層的軟件工具(如CUDA),以支持他們的設(shè)備時,AccelerEyes 開發(fā)了高層的接口,完全屏蔽了底層硬件的復(fù)雜性。
AccelerEyes的第一個產(chǎn)品——Jacket,適用于很多行業(yè)的HPC應(yīng)用,如:汽車制造、金融、醫(yī)療以及地質(zhì)等行業(yè)。此外,Jacket的圖形工具包能做的真正的視覺計算,能準(zhǔn)確的將計算機的CUDA OpenGL可視化進行融合。
2. Jacket Engine運行
Jacket是MATLAB代碼在GPU上運行的插件。Jacket使標(biāo)準(zhǔn)的MATLAB代碼能夠在GPU上運行,并給用戶提供MATLAB的友好界面,帶來GPU可視化計算的速度。
Jacket不僅提供了GPU API(應(yīng)用程序接口),而且還集成了GPU MEX功能。在一定程度說,Jacket是一個完全對用戶透明的系統(tǒng),能夠自動的進行內(nèi)存分配和自動優(yōu)化。Jacket使用了一個叫“on-the-fly”的編譯系統(tǒng),使MATLAB交互式格式的程序能夠在GPU上運行。
目前,Jacket只是基于NVIDIA的CUDA技術(shù)。
3、圖形化工具包
Jacket同樣包含有MATLAB開發(fā)的圖形化工具包(支持目前的所有操作系統(tǒng))。Jacket集成的圖形化工具包的計算引擎能夠完全發(fā)揮您的GPU 的全部OpenGL功能。這種計算和可視化的集成是您能做到開發(fā)真正的視覺計算
4. Matlab計算--移植到GPU平臺非常簡單,功能更強大
Jacket是Matlab的GPU插件。Jacket能夠使標(biāo)準(zhǔn)的MATLAB代碼能夠運行在任何NVIDIA的支持CUDA的GPU上,從Geforce8400到Tesla C1060。用法很簡單——Jacket為MATLAB引入了新的數(shù)據(jù)類型,這使得您能將您的數(shù)據(jù)移植到GPU上運算。
>> G = gones( 3 ); % 創(chuàng)建一個 GPU矩陣
>> G = fft( G ); % 執(zhí)行一個 GPU FFT
>> G = G * G; % GPU 矩陣乘法
>> C = double( G ); % 返回到CPU模式
MATLAB代碼例子:
很簡單吧!僅僅只需更改數(shù)據(jù)類型,就能開始使用GPU的強大運算能力了,NVIDIA Tesla C1060具有240個GPU處理器(核)?,F(xiàn)在您可以把以前巨大的集群系統(tǒng)拋棄了,來享受帶有Jacket的個人超級運算計算機吧!
Jacket圖形工具包極大的改善了MTLAB的可視化計算。想法同樣很簡單——使數(shù)據(jù)在GPU中進行可視化計算而不需要將數(shù)據(jù)返回至CPU。