深度學(xué)習(xí)訓(xùn)練與推理計(jì)算平臺(tái)硬件配置完美選型2020v1
支持6塊RTX3090靜音級(jí)深度學(xué)習(xí)工作站硬件配置方案2020v4
人工智能隨著核心算法、計(jì)算能力的迅速提升,以及海量聯(lián)網(wǎng)數(shù)據(jù)的支持,在本世紀(jì)終于迎來了質(zhì)的飛躍,人工智能將是未來應(yīng)用最廣泛的技術(shù)之一,在市場(chǎng)經(jīng)濟(jì)領(lǐng)域帶來更多的機(jī)遇與機(jī)會(huì),在醫(yī)學(xué)領(lǐng)域可以大大加快診斷速度和準(zhǔn)確性,在軍事領(lǐng)域人工智能武器將成為未來武器的王牌……
(一)了解深度學(xué)習(xí)算法
深度學(xué)習(xí)兩個(gè)主要過程:訓(xùn)練(Training)和推理(Inference)。其中:
訓(xùn)練(Training)是將大量數(shù)據(jù)加載到機(jī)器中并分析數(shù)據(jù)以建立用于分類,識(shí)別,預(yù)測(cè)等的模式的過程(已建立的模式稱為訓(xùn)練后的模型),訓(xùn)練需要高速密集并行計(jì)算---“高性能計(jì)算”
任務(wù)領(lǐng)域
原始輸入
淺層特層 中層特征 高層特征
訓(xùn)練目標(biāo)
語(yǔ)音
樣本
頻段 聲音 音調(diào) 音素 單詞
語(yǔ)音識(shí)別
圖像
像素
線條 紋理 圖案 局部 物體
圖像識(shí)別
文本
字母
單詞 詞組 短語(yǔ) 段落 文正
語(yǔ)義理解
推理(Inference)是將未知數(shù)據(jù)輸入到通過學(xué)習(xí)過程創(chuàng)建的訓(xùn)練模型中,然后根據(jù)已建立的模式對(duì)數(shù)據(jù)進(jìn)行實(shí)際分類,識(shí)別和預(yù)測(cè)的過程,推理需要快速將推理結(jié)果轉(zhuǎn)化為行動(dòng)—“邊緣計(jì)算”、實(shí)時(shí)要求高
深度學(xué)習(xí)是指多層神經(jīng)網(wǎng)絡(luò)上運(yùn)用各種機(jī)器學(xué)習(xí)算法解決圖像、文本、語(yǔ)音等各種問題的算法集合
典型算法
應(yīng)用領(lǐng)域
CNN卷積神經(jīng)網(wǎng)絡(luò)
計(jì)算機(jī)視覺:醫(yī)學(xué)圖像分析、圖像識(shí)別、面部檢測(cè)、識(shí)別系統(tǒng)、全動(dòng)態(tài)視頻分析,自動(dòng)駕駛,衛(wèi)星圖像
藥物發(fā)現(xiàn)、推薦引擎、游戲
RNN遞歸神經(jīng)網(wǎng)絡(luò)
變體:LSTM、GRU、NTM、雙向RNN
自然語(yǔ)言處理(NLP):機(jī)器翻譯、情感處理,語(yǔ)言生成,文本分類和句子完成:
時(shí)間序列預(yù)測(cè):股票預(yù)測(cè)、金融工程,應(yīng)用物理、醫(yī)學(xué)醫(yī)藥
順序圖像處理:圖像分類、圖像字幕
分割的手寫識(shí)別、語(yǔ)音識(shí)別
問題解答系統(tǒng),機(jī)器人控制,
DBN深度信念網(wǎng)絡(luò)
圖像識(shí)別、信息檢索、自然語(yǔ)言理解、故障預(yù)測(cè)
DSN深度堆棧網(wǎng)絡(luò)
信息檢索、連續(xù)語(yǔ)音識(shí)別
GAN生成對(duì)抗網(wǎng)絡(luò)
圖像樣式轉(zhuǎn)換,高分辨率圖像合成,文本到圖像合成,圖像超分辨率[例如小劑量PET重建,異常檢測(cè),3D對(duì)象生成[例如牙齒修復(fù)],音樂生成,科學(xué)模擬加速度(例如天體物理學(xué)或高能物理
Autoencoder自動(dòng)編碼器
推薦系統(tǒng),圖像重構(gòu)、聚類、機(jī)器翻譯,異常值檢測(cè)、數(shù)據(jù)去噪(圖像、音頻),圖像修復(fù),信息檢索
(二)深度學(xué)習(xí)主流算法計(jì)算特點(diǎn)
2019年,Nvidia(英偉達(dá))公司上市Turing架構(gòu)的RTX系列的GPU卡,增加了Tensor張量計(jì)算單元,大幅提升了深度學(xué)習(xí)關(guān)鍵的矩陣乘法計(jì)算、卷積計(jì)算(借助張量Tensors),GPU卡性能的關(guān)鍵指標(biāo):Tensor張量核數(shù)、顯存帶寬、FP16/FP32計(jì)算精度
目前可選GPU型號(hào)(2020年1季度)的主要技術(shù)參數(shù)
型號(hào)
CUDA核
張量
核數(shù)
顯存1
顯存帶寬2
張量計(jì)算3
FP16半精度計(jì)算4
FP32單精度計(jì)算5
Quadro GV100
5120
640
32
870
133
33.32
16.66
Quadro RTX8000
4608
576
48
672
130
32.62
16.31
Quadro RTX6000
4608
576
24
672
130
32.62
16.31
Titan RTX
4608
576
24
672
130
32.62
16.31
TITAN V
5120
640
12
651
119
29.80
14.90
TESLA V100
5120
640
16
897
113
28.26
14.13
RTX2080Ti
4352
544
11
616
108
26.90
13.45
Quadro RTX5000
3072
384
16
448
89
22.30
11.15
RTX2080S
3072
368
8
496
85
22.30
11.15
TESLA T4
2560
320
16
320
65
65.13
8.14
RTX2070S
2560
288
8
448
65
18.12
9.06
Quadro RTX4000
2304
288
8
416
57
14.24
7.12
RTX2060S
2176
272
6
336
57
14.36
7.18
標(biāo)注1 顯存單位GB,標(biāo)注2 顯存帶寬單位GB/s,標(biāo)注3-5 單位Tflops(每秒萬億次)
應(yīng)用1 CNN(卷積神經(jīng)網(wǎng)絡(luò))計(jì)算特點(diǎn)
這類應(yīng)用主要是計(jì)算機(jī)視覺應(yīng)用,計(jì)算機(jī)獲得對(duì)圖像的高級(jí)“理解”。為了評(píng)估模型是否真正“理解”了圖像,研究人員開發(fā)了不同的評(píng)估方法來衡量性能
主要算法:卷積神經(jīng)網(wǎng)絡(luò)(CNN)
- CNN主要模型:AlexNet,VGG,GoogleNet, ResNet, Inception 等
- 主流深度學(xué)習(xí)框架:Theano、Caffe、MXNet、TensorFlow、Torch/Pytorch
-
CNN多GPU并行計(jì)算特點(diǎn):非常理想
利用GPU加速主要是在conv(卷積)過程上,conv過程可以像向量加法一樣通過CUDA實(shí)現(xiàn)并行化。具體的方法很多,最好的是用FFT(快速傅里葉變換)進(jìn)行快速卷積,NVIDIA提供了cuFFT庫(kù)實(shí)現(xiàn)FFT,復(fù)數(shù)乘法則可以用cuBLAS庫(kù)里的對(duì)應(yīng)的level3的cublasCgemm函數(shù)。
GPU加速的基本準(zhǔn)則就是“人多力量大”。CNN說到底主要問題就是計(jì)算量大,但是卻可以比較有效的拆分成并行問題。隨便拿一個(gè)層的filter來舉例子,假設(shè)某一層有n個(gè)filter,每一個(gè)需要對(duì)上一層輸入過來的map進(jìn)行卷積操作。那么,這個(gè)卷積操作并不需要按照線性的流程去做,每個(gè)濾波器互相之間并不影響,可以大家同時(shí)做,然后大家生成了n張新的譜之后再繼續(xù)接下來的操作。既然可以并行,那么同一時(shí)間處理單元越多,理論上速度優(yōu)勢(shì)就會(huì)越大。所以,處理問題就變得很簡(jiǎn)單粗暴,就像NV那樣,暴力增加顯卡單元數(shù)(當(dāng)然,顯卡的架構(gòu)、內(nèi)部數(shù)據(jù)的傳輸速率、算法的優(yōu)化等等也都很重要)。
GPU計(jì)算性能出眾的根本原因是處理矩陣算法能力的非常強(qiáng)大,CNN中涉及大量的卷積,也就是矩陣乘法等,所以在這方面具有優(yōu)勢(shì),GPU上的TFLOP是ResNet和其他卷積架構(gòu)性能的最佳指標(biāo)。Tensor Core可以顯著增加FLOP,使用卷積網(wǎng)絡(luò),則應(yīng)首先確定具有高GPU張量計(jì)算能力的優(yōu)先級(jí),然后分配高FLOPs的CUDA數(shù)量,然后分配高內(nèi)存帶寬,然后分配具有FP16位精度數(shù)據(jù)
- CNN硬件配置要點(diǎn):Tensors> FLOP> 顯存> 半精度計(jì)算(FP16)
GPU可選型號(hào):
No
CUDAs
Tensors
顯存1
顯存帶寬2
張量計(jì)算3
F16半精度4
F32單精度5
1
Quadro GV100
5120
640
32
870
133
33.32
16.66
4608
576
48
672
130
32.62
16.31
Quadro RTX6000
4608
576
24
672
130
32.62
16.31
Titan RTX
4608
576
24
672
130
32.62
16.31
2
TITAN V
5120
640
12
651
119
29.80
14.90
TESLA V100
5120
640
16
897
113
28.26
14.13
RTX2080Ti
4352
544
11
616
108
26.90
13.45
3
3072
384
16
448
89
22.30
11.15
RTX2080S
3072
368
8
496
85
22.30
11.15
4
TESLA T4
2560
320
16
320
65
65.13
8.14
RTX2070S
2560
288
8
448
65
18.12
9.06
2304
288
8
416
57
14.24
7.12
RTX2060S
2176
272
6
336
57
14.36
7.18
標(biāo)注1—單位GB,標(biāo)注2—單位GB/s, 標(biāo)注3~5 ---單位TFlops
說明:
GPU卡型號(hào)
顯存
計(jì)算規(guī)模
說明
1
RTX2070s
RTX2080s
RTX2080ti
8GB
8GB
11GB
小型模型開發(fā)
較小的GPU內(nèi)存占用空間,
高吞吐量工作負(fù)載應(yīng)用
渦輪式散熱,單臺(tái)工作站中最多配置8個(gè)
2
Titan RTX
24GB
中等模型開發(fā)
大顯存支持使用更大的批處理
需要訓(xùn)練大型計(jì)算機(jī)視覺模型,TITAN RTX可以做到。
最多4塊,不支持密集地裝進(jìn)工作站
3
RTX6000
24GB
中大等規(guī)模開發(fā)
配備渦輪風(fēng)扇,支持密集安裝
支持單機(jī)最大9塊
4
RTX8000
48GB
超大規(guī)模
擁有所有NVIDIA GPU中最大的內(nèi)存容量,
配備渦輪風(fēng)扇,支持密集安裝
支持單機(jī)最大9塊
應(yīng)用2 RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))計(jì)算特點(diǎn)
這類典型應(yīng)用主要是自然語(yǔ)言處理(NLP),包括語(yǔ)音識(shí)別,語(yǔ)言翻譯,語(yǔ)音轉(zhuǎn)文本和Q&A系統(tǒng)。
- 主要算法:RNN(包括變體: LSTM、GRU、NTM、雙向RNN等)、Transformer
-
主流框架:CNTK、Torch/PyTorch、Keras
-
多GPU并行計(jì)算: 不明確,跟程序設(shè)計(jì)、算法、框架、SDK以及具體應(yīng)用都有很大關(guān)系,一些應(yīng)用CPU多核并行反倒更快。
RNN和LSTM的訓(xùn)練并行計(jì)算是困難的,因?yàn)樗鼈冃枰鎯?chǔ)帶寬綁定計(jì)算,這是硬件設(shè)計(jì)者的噩夢(mèng),最終限制了神經(jīng)網(wǎng)絡(luò)解決方案的適用性。簡(jiǎn)而言之,LSTM需要每個(gè)單元4個(gè)線性層(MLP層)在每個(gè)序列時(shí)間步驟中運(yùn)行。線性層需要大量的存儲(chǔ)帶寬來計(jì)算,事實(shí)上,它們不能使用許多計(jì)算單元,通常是因?yàn)橄到y(tǒng)沒有足夠的存儲(chǔ)帶寬來滿足計(jì)算單元。而且很容易添加更多的計(jì)算單元,但是很難增加更多的存儲(chǔ)帶寬(注意芯片上有足夠的線,從處理器到存儲(chǔ)的長(zhǎng)電線等)
GPU內(nèi)存非常重要,因?yàn)橹T如XLNet和BERT之類的transformer網(wǎng)絡(luò)需要大量的內(nèi)存才能達(dá)到最高的精度,考慮矩陣乘法A*B=C的一種簡(jiǎn)單有效的方法是受內(nèi)存(顯存)帶寬限制:將A,B的內(nèi)存復(fù)制到芯片上比進(jìn)行A * B的計(jì)算要昂貴。這意味著如果您要使用LSTM和其他執(zhí)行大量小矩陣乘法的循環(huán)網(wǎng)絡(luò),則內(nèi)存(顯存)帶寬是GPU的最重要功能。矩陣乘法越小,內(nèi)存(顯存)帶寬就越重要,介于卷積運(yùn)算和小型矩陣乘法之間的transformer在整體求解過程環(huán)節(jié)中并行效率低,加快方式提升顯存帶寬和足夠的顯存容量
- RNN硬件配置要點(diǎn): 顯存帶寬+顯存> 半精度計(jì)算(FP16) > Tensors> FLOP
GPU可選型號(hào)
No
CUDAs
Tensors
顯存1
顯存帶寬 2
張量計(jì)算3
F16半精度4
FP32單精度5
1
TESLA V100
5120
640
16
897
113
28.26
14.13
Quadro GV100
5120
640
32
870
133
33.32
16.66
2
4608
576
48
672
130
32.62
16.31
Quadro RTX6000
4608
576
24
672
130
32.62
16.31
Titan RTX
4608
576
24
672
130
32.62
16.31
TITAN V
5120
640
12
651
119
29.80
14.90
RTX2080Ti
4352
544
11
616
108
26.90
13.45
3
RTX2080S
3072
368
8
496
85
22.30
11.15
Quadro RTX5000
3072
384
16
448
89
22.30
11.15
RTX2070S
2560
288
8
448
65
18.12
9.06
2304
288
8
416
57
14.24
7.12
4
RTX2060S
2176
272
6
336
57
14.36
7.18
TESLA T4
2560
320
16
320
65
65.13
8.14
說明
GPU卡型號(hào)
顯存
可選
說明
1
RTX5000
16GB
Good
擁有16GB顯存,
2
Titan RTX
24GB
Better
支持NVLink橋接,加速訓(xùn)練更大的NLP網(wǎng)絡(luò)模型,
RTX6000
24GB
Better
類似TITAN RTX性能指標(biāo),
渦輪散熱設(shè)計(jì)允許密集配置,支持單機(jī)最大9塊卡擴(kuò)展
3
Quadro GV100
32GB
Best
擁有最高的顯存帶寬870GB/s和最高的張量算力
3
RTX8000
48GB
Best
擁有最大48GB顯存,是NLP的最佳GPU
渦輪散熱設(shè)計(jì)允許密集配置,支持單機(jī)最大9塊卡擴(kuò)展
(四)深度學(xué)習(xí)計(jì)算系統(tǒng)平臺(tái)配備
4.1深度學(xué)習(xí)框架對(duì)比
框架
重點(diǎn)應(yīng)用
編程語(yǔ)言
多GPU速度
深度學(xué)習(xí)主要算法
CNN
RNN
/LTSM
GAN
RBM/
DBN
TensorFlow
自然語(yǔ)言處理,文本分類/摘要,語(yǔ)音/圖像/手寫識(shí)別,預(yù)測(cè)和標(biāo)記
Python ,
C++,
R語(yǔ)言
++
+++
++
支持
Caffe
視覺識(shí)別
C,C++,Python,Matlab
+
++
CNTK
手寫和語(yǔ)音識(shí)別.處理圖像
C++,Python
++
+
+++
支持
PyTorch
處理圖像,手寫和語(yǔ)音識(shí)別
CUDA,C/C++
+++
+++
++
支持
支持
MXNet
圖像,手寫/語(yǔ)音識(shí)別,預(yù)測(cè)和NLP
Python,R,C++
Julia,CUDA
+++
+++
+
支持
Chainer
情感分析,機(jī)器翻譯,語(yǔ)音識(shí)別
CUDA
支持
支持
Keras
分類,文本生成和摘要,標(biāo)記和翻譯,以及語(yǔ)音識(shí)別
Python
支持
支持
DL4J
圖像識(shí)別,欺詐檢測(cè),文本挖掘,詞性標(biāo)記和自然語(yǔ)言處理
Java
支持
支持
支持
Theano
Python
+
++
++
4.2 深度學(xué)習(xí)開發(fā)庫(kù)SDK
開發(fā)環(huán)境:CUDA Toolkit
訓(xùn)練SDK:cuDNN (7.0版本支持Tensor Core)、NCCL、cuBLAS、cuSPARSE
推理SDK:TensorRT(版本3.0支持Tensor Core)、DALI
4.3 深度學(xué)習(xí)操作系統(tǒng)
操作系統(tǒng):Windows 10 Pro 64位+ Ubuntu 18.04或RHEL 7.5
容器:Docker 18.06.1,NVIDIA Docker運(yùn)行時(shí)v2.0.3
容器:RAPIDS容器
#p#page_title#e#
(五)深度學(xué)習(xí)計(jì)算硬件配置推薦
打造一個(gè)快速高效的深度學(xué)習(xí)計(jì)算平臺(tái),涉及到多方面因素:
(1)超算硬件設(shè)備-—GPU、CPU、內(nèi)存、硬盤io…
(2)深度學(xué)習(xí)算法---CNN、RNN…
(3)深度學(xué)習(xí)框架---Tensorflow、PyTorch…
(4)開發(fā)庫(kù)SDK---CUDA、cuDNN…
(5)程序設(shè)計(jì)算法優(yōu)化—-張量單元、FP16精度數(shù)據(jù)計(jì)算、針對(duì)算法SDK優(yōu)化、多卡并行優(yōu)化算法…
5.1 深度學(xué)習(xí)工作站配置推薦(科研類)
機(jī)型:UltraLAB GX380i/GT410
支持2~4塊GPU卡
配備nvidia RTX---配置張量計(jì)算單元Tensor,支持intel AVX-512
No
產(chǎn)品型號(hào)
主要配置
FP16半精度性能
顯存帶寬
顯存
理想算法
價(jià)格
1.1
GX380i 14932-SA2X
intel第9代處理器(6核@4.9Ghz )/32GB DDR4 /2*RTX2070s/960GB SSD /4TB SATA/微塔式(2000w)/23"圖顯
36Tops
448GB/s
16GB
CNN
¥29,990
1.2
GX380i 14964-SB2X
intel第9代處理器(6核@4.9Ghz)/64GB DDR4/ 2*RTX2080Ti/1.9TB SSD/4TB SATA/微塔式(1200w)/23"圖顯
54Tops
616GB/s
22GB
CNN
¥49,990
1.3
GX380i 14964-SB2D
intel第9代處理器(6核@4.9Ghz) /64GB DDR4 / 2*RTX5000/1.9TB SSD/6TB SATA/微塔式(2000w)/23"圖顯
45Tops
448GB/s
32GB
RNN
¥69,990
1.4
GX380i 14996-SB2T
intel第9代處理器(8核4.9Ghz) /96GB DDR4 / 2*Titan RTX /1.9TB SSD/6TB SATA/微塔式(2000w)/23"圖顯
65Tops
672GB/s
48GB
CNN+ RNN
¥97,500
1.5
GX380i 15096-SB2T
intel第9代處理器(8核5.0Ghz) /128GB DDR4 /2*Quadro GV100 /960TB SSD+2TB M2.SSD /6TB SATA/微塔式(2000w)/23"圖顯
67Tops
870GB/s
64GB
RNN
¥169,990
1.6
GT410i 14664-SB4X
intel第10代至尊處理器(10核4.6Ghz) /64GB DDR4 /4*RTX2080s /1.92TB SSD/4TB SATA/微塔式(2000W)/23"圖顯
89Tops
496GB/s
32GB
CNN
¥69,990
1.7
GT410i 14596-SB4X
intel第10代至尊處理器(12核4.5Ghz ) /96GB DDR4 /4*RTX2080Ti /1.92TB SSD /6TB SATA/微塔式(2000W)/23"圖顯
108Tops
616GB/s
44GB
CNN
¥89,990
1.8
GT410i 145192-SC4E
intel第10代至尊處理器(12核4.5Ghz ) /192GB DDR4 /4*RTX6000/ 3.84TB SSD/10TB SATA/微塔式(2000W)/23"圖顯
131Tops
672GB/s
96GB
CNN+ RNN
¥210,000
1.9
GT410i 142256-SC4F
intel第10代至尊處理器(18核4.2Ghz ) /256GB DDR4 /4*RTX8000/3.84TB SSD/10TB SATA/微塔式(2000W)/23"圖顯
131Tops
672GB/s
192GB
RNN
¥330,000
1.10
GT410i 142256-SC4G
intel第10代至尊處理器(18核4.2Ghz ) /256GB DDR4/4*Qudro GV100/3.84TB SSD /10TB SATA/微塔式(2000W)/23"圖顯
133Tops
870GB/s
64GB
RNN
¥350,000
5.2 深度學(xué)習(xí)工作站配置推薦(高性能類)
機(jī)型:UltraLAB GT410P
支持支持5~7塊GPU
No
產(chǎn)品型號(hào)
主要配置
FP16半精度性能
顯存帶寬
顯存
理想算法
價(jià)格
2.1
GT410P 14696-SB5X
intel第10代至尊處理器 (10核4.6Ghz)、96GB DDR4 /5*RTX2080s/1.92TB SSD+6TB SATA /雙塔式(雙2000w)/27"-4K圖顯
112Tops
496GB/s
40GB
CNN
¥97,000
2.2
GT410P 14596-SB6X
intel第10代至尊處理器 (12核4.5Ghz)、96GB DDR4 /6*RTX2080s/1.9TB SSD+ 8TB SATA /雙塔式(雙2000w)/27"-4K圖顯
134Tops
496GB/s
48GB
CNN
¥108,000
2.3
GT410P 145128-SB7X
intel第10代至尊處理器 (12核4.5Ghz)、128GB DDR4 /7*RTX2080s/1.9TB SSD+ 10TB SATA/ /雙塔式(雙2000w)/27"-4K圖顯
156Tops
496GB/s
56GB
CNN
¥118,000
2.4
GT410P 145192-SC7X
intel第10代至尊處理器 (12核4.5Ghz)、192GB DDR4 /7*RTX2080Ti 3.84TB SSD+ 8TB SATA/ 雙塔式(雙2000w)/27"-4K圖顯
188Tops
616GB/s
77GB
CNN
¥148,000
2.5
GT410P 145192-SC5T
intel第10代至尊處理器 (12核4.5Ghz)、192GB DDR4 /5*Titan RTX/3.84TB SSD+ 10TB SATA/雙塔式(雙2000w)/27"-4K圖顯
163Tops
672GB/s
120GB
CNN+ RNN
¥228,000
2.6
GT410P 142256-SC7E
intel第10代至尊處理器 (18核4.2Ghz)、256GB DDR4 /7*RTX6000/3.84TB SSD+ 14TB SATA/雙塔式(雙2000w)/27"-4K圖顯
228Tops
672GB/s
168GB
CNN+ RNN
¥370,000
2.7
GT410P 142256-SC7F
intel第10代至尊處理器 (18核4.2Ghz)、256GB DDR4 /7*RTX8000/3.84TB SSD+ 14TB SATA/雙塔式(雙2000w)/27"-4K圖顯
228Tops
672GB/s
240GB
RNN
¥535,000
5.3 深度學(xué)習(xí)工作站配置推薦(超級(jí)類)
機(jī)型:UltraLAB GX630M)
支持8~9塊GPU
No |
產(chǎn)品型號(hào) |
主要配置 |
FP16半精度性能 |
顯存帶寬 |
內(nèi)存/顯存 |
理想算法 |
價(jià)格 |
3.1 |
GX630M 237192-MB9X |
2*Xeon金6234(16核3.7GHz)/ 睿頻4GHz /192GB DDR4 /9*RTX2080s/960GB SSD+2TB M2.SSD/28TB存儲(chǔ)/雙塔/27"-4K圖顯 |
201Tops |
496GB/s |
40GB |
CNN |
¥199,990 |
3.2 |
GX630M 243192-MB8X |
2*Xeon金6244(16核4.3GHz)/ 睿頻4.3GHz /192GB DDR4 /8*RTX2080Ti/1.9TB SSD+2TB M2.SSD/42TB存儲(chǔ)/雙塔/27"-4K圖顯 |
215Tops |
616GB/s |
88GB |
CNN |
¥245,000 |
3.3 |
GX630M 241384-60T7T |
2*Xeon金6246(24核4.1GHz)/ 睿頻4.2GHz /384GB DDR4 /7*Titan RTX/3.84TB SSD /60TB并行存儲(chǔ)/雙塔/27"-4K圖顯 |
228Tops- |
672GB/s |
168GB |
CNN+ RNN |
¥399,990 |
3.4 |
GX630M 241384-42T8E |
2*Xeon金6246(24核4.1GHz)/ 睿頻4.2GHz /384GB DDR4 /8*RTX6000/1.92TB SSD+2TB M2.SSD/42TB并行存儲(chǔ)/雙塔/32"-4K圖顯 |
261Tops |
672GB/s |
192GB |
CNN+ RNN |
¥499,990 |
3.5 |
GX630M 239768-150T8F |
2*Xeon金6254(36核3.9GHz)/ 睿頻4.0GHz /768GB DDR4 /8*RTX8000/3.84TB SSD+3.2TB P-SSD/150TB并行存儲(chǔ)/雙塔/32"-4K圖顯 |
261Tops |
672GB/s |
384GB |
CNN+ RNN+ 推理 |
¥750,000 |
3.6 |
GX630M 235768-210T8G |
2*Xeon白金8268(48核3.5GHz)/睿頻3.9GHz /768GB DDR4 /8*QGV100 /3.84TB SSD /6.4TB P-SSD/210TB并行存儲(chǔ)/雙塔/32"-4K圖顯 |
266Tops |
870GB/s |
256GB |
CNN+ RNN+ 推理 |
¥850,000 |
3.7 |
GX630M 2331T-266T9F |
2*Xeon白金8280(56核3.3GHz/ 睿頻4.0GHz /1TB DDR4 /9*RTX8000/3.84TB SSD系統(tǒng)盤/6.4TB P-SSD/266TB并行存儲(chǔ)/雙塔/32"-4K圖顯 |
293Tops-地球最強(qiáng) |
672GBs |
432GB |
CNN+ RNN+ 推理 |
¥999,990 |
UltraLAB圖形工作站供貨商:
西安坤隆計(jì)算機(jī)科技有限公司
國(guó)內(nèi)知名高端定制圖形工作站廠家
業(yè)務(wù)電話:400-705-6800
咨詢微信號(hào):