您的位置：UltraLAB圖形工作站方案網(wǎng)站 > 人工智能 > 深度學(xué)習(xí) > 深度學(xué)習(xí)訓(xùn)練與推理計(jì)算平臺(tái)硬件配置完美選型2020v1

深度學(xué)習(xí)訓(xùn)練與推理計(jì)算平臺(tái)硬件配置完美選型2020v1

時(shí)間：2020-02-17 00:53:00 來源：UltraLAB圖形工作站方案網(wǎng)站 人氣：27951 作者：admin

支持6塊RTX3090靜音級(jí)深度學(xué)習(xí)工作站硬件配置方案2020v4

人工智能隨著核心算法、計(jì)算能力的迅速提升，以及海量聯(lián)網(wǎng)數(shù)據(jù)的支持，在本世紀(jì)終于迎來了質(zhì)的飛躍，人工智能將是未來應(yīng)用最廣泛的技術(shù)之一，在市場(chǎng)經(jīng)濟(jì)領(lǐng)域帶來更多的機(jī)遇與機(jī)會(huì)，在醫(yī)學(xué)領(lǐng)域可以大大加快診斷速度和準(zhǔn)確性，在軍事領(lǐng)域人工智能武器將成為未來武器的王牌……

（一）了解深度學(xué)習(xí)算法
深度學(xué)習(xí)兩個(gè)主要過程：訓(xùn)練（Training）和推理（Inference）。其中：
訓(xùn)練（Training）是將大量數(shù)據(jù)加載到機(jī)器中并分析數(shù)據(jù)以建立用于分類，識(shí)別，預(yù)測(cè)等的模式的過程（已建立的模式稱為訓(xùn)練后的模型），訓(xùn)練需要高速密集并行計(jì)算---“高性能計(jì)算”

任務(wù)領(lǐng)域	原始輸入	淺層特層中層特征高層特征	訓(xùn)練目標(biāo)
語(yǔ)音	樣本	頻段聲音音調(diào) 音素單詞	語(yǔ)音識(shí)別
圖像	像素	線條紋理圖案局部物體	圖像識(shí)別
文本	字母	單詞詞組短語(yǔ) 段落文正	語(yǔ)義理解

推理（Inference）是將未知數(shù)據(jù)輸入到通過學(xué)習(xí)過程創(chuàng)建的訓(xùn)練模型中，然后根據(jù)已建立的模式對(duì)數(shù)據(jù)進(jìn)行實(shí)際分類，識(shí)別和預(yù)測(cè)的過程，推理需要快速將推理結(jié)果轉(zhuǎn)化為行動(dòng)—“邊緣計(jì)算”、實(shí)時(shí)要求高

深度學(xué)習(xí)是指多層神經(jīng)網(wǎng)絡(luò)上運(yùn)用各種機(jī)器學(xué)習(xí)算法解決圖像、文本、語(yǔ)音等各種問題的算法集合

典型算法	應(yīng)用領(lǐng)域
CNN卷積神經(jīng)網(wǎng)絡(luò)	計(jì)算機(jī)視覺：醫(yī)學(xué)圖像分析、圖像識(shí)別、面部檢測(cè)、識(shí)別系統(tǒng)、全動(dòng)態(tài)視頻分析，自動(dòng)駕駛，衛(wèi)星圖像藥物發(fā)現(xiàn)、推薦引擎、游戲
RNN遞歸神經(jīng)網(wǎng)絡(luò) 變體：LSTM、GRU、NTM、雙向RNN	自然語(yǔ)言處理(NLP)：機(jī)器翻譯、情感處理，語(yǔ)言生成，文本分類和句子完成：時(shí)間序列預(yù)測(cè)：股票預(yù)測(cè)、金融工程，應(yīng)用物理、醫(yī)學(xué)醫(yī)藥順序圖像處理:圖像分類、圖像字幕分割的手寫識(shí)別、語(yǔ)音識(shí)別問題解答系統(tǒng)，機(jī)器人控制，
DBN深度信念網(wǎng)絡(luò)	圖像識(shí)別、信息檢索、自然語(yǔ)言理解、故障預(yù)測(cè)
DSN深度堆棧網(wǎng)絡(luò)	信息檢索、連續(xù)語(yǔ)音識(shí)別
GAN生成對(duì)抗網(wǎng)絡(luò)	圖像樣式轉(zhuǎn)換，高分辨率圖像合成，文本到圖像合成，圖像超分辨率[例如小劑量PET重建，異常檢測(cè)，3D對(duì)象生成[例如牙齒修復(fù)]，音樂生成，科學(xué)模擬加速度（例如天體物理學(xué)或高能物理
Autoencoder自動(dòng)編碼器	推薦系統(tǒng)，圖像重構(gòu)、聚類、機(jī)器翻譯，異常值檢測(cè)、數(shù)據(jù)去噪(圖像、音頻)，圖像修復(fù)，信息檢索

（二）深度學(xué)習(xí)主流算法計(jì)算特點(diǎn)

2019年，Nvidia（英偉達(dá)）公司上市Turing架構(gòu)的RTX系列的GPU卡，增加了Tensor張量計(jì)算單元，大幅提升了深度學(xué)習(xí)關(guān)鍵的矩陣乘法計(jì)算、卷積計(jì)算（借助張量Tensors）,GPU卡性能的關(guān)鍵指標(biāo)：Tensor張量核數(shù)、顯存帶寬、FP16/FP32計(jì)算精度

目前可選GPU型號(hào)（2020年1季度）的主要技術(shù)參數(shù)

型號(hào)	CUDA核	張量核數(shù)	顯存¹	顯存帶寬²	張量計(jì)算³	FP16半精度計(jì)算⁴	FP32單精度計(jì)算⁵
Quadro GV100	5120	640	32	870	133	33.32	16.66
Quadro RTX8000	4608	576	48	672	130	32.62	16.31
Quadro RTX6000	4608	576	24	672	130	32.62	16.31
Titan RTX	4608	576	24	672	130	32.62	16.31
TITAN V	5120	640	12	651	119	29.80	14.90
TESLA V100	5120	640	16	897	113	28.26	14.13
RTX2080Ti	4352	544	11	616	108	26.90	13.45
Quadro RTX5000	3072	384	16	448	89	22.30	11.15
RTX2080S	3072	368	8	496	85	22.30	11.15
TESLA T4	2560	320	16	320	65	65.13	8.14
RTX2070S	2560	288	8	448	65	18.12	9.06
Quadro RTX4000	2304	288	8	416	57	14.24	7.12
RTX2060S	2176	272	6	336	57	14.36	7.18

標(biāo)注1 顯存單位GB，標(biāo)注2 顯存帶寬單位GB/s，標(biāo)注3-5 單位Tflops（每秒萬億次）

應(yīng)用1 CNN（卷積神經(jīng)網(wǎng)絡(luò)）計(jì)算特點(diǎn)
這類應(yīng)用主要是計(jì)算機(jī)視覺應(yīng)用，計(jì)算機(jī)獲得對(duì)圖像的高級(jí)“理解”。為了評(píng)估模型是否真正“理解”了圖像，研究人員開發(fā)了不同的評(píng)估方法來衡量性能
主要算法：卷積神經(jīng)網(wǎng)絡(luò)（CNN）

CNN主要模型：AlexNet，VGG，GoogleNet, ResNet, Inception 等
主流深度學(xué)習(xí)框架：Theano、Caffe、MXNet、TensorFlow、Torch/Pytorch
CNN多GPU并行計(jì)算特點(diǎn)：非常理想

利用GPU加速主要是在conv（卷積）過程上，conv過程可以像向量加法一樣通過CUDA實(shí)現(xiàn)并行化。具體的方法很多，最好的是用FFT（快速傅里葉變換）進(jìn)行快速卷積，NVIDIA提供了cuFFT庫(kù)實(shí)現(xiàn)FFT，復(fù)數(shù)乘法則可以用cuBLAS庫(kù)里的對(duì)應(yīng)的level3的cublasCgemm函數(shù)。

GPU加速的基本準(zhǔn)則就是“人多力量大”。CNN說到底主要問題就是計(jì)算量大，但是卻可以比較有效的拆分成并行問題。隨便拿一個(gè)層的filter來舉例子，假設(shè)某一層有n個(gè)filter，每一個(gè)需要對(duì)上一層輸入過來的map進(jìn)行卷積操作。那么，這個(gè)卷積操作并不需要按照線性的流程去做，每個(gè)濾波器互相之間并不影響，可以大家同時(shí)做，然后大家生成了n張新的譜之后再繼續(xù)接下來的操作。既然可以并行，那么同一時(shí)間處理單元越多，理論上速度優(yōu)勢(shì)就會(huì)越大。所以，處理問題就變得很簡(jiǎn)單粗暴，就像NV那樣，暴力增加顯卡單元數(shù)（當(dāng)然，顯卡的架構(gòu)、內(nèi)部數(shù)據(jù)的傳輸速率、算法的優(yōu)化等等也都很重要）。

GPU計(jì)算性能出眾的根本原因是處理矩陣算法能力的非常強(qiáng)大，CNN中涉及大量的卷積，也就是矩陣乘法等，所以在這方面具有優(yōu)勢(shì),GPU上的TFLOP是ResNet和其他卷積架構(gòu)性能的最佳指標(biāo)。Tensor Core可以顯著增加FLOP，使用卷積網(wǎng)絡(luò)，則應(yīng)首先確定具有高GPU張量計(jì)算能力的優(yōu)先級(jí)，然后分配高FLOPs的CUDA數(shù)量，然后分配高內(nèi)存帶寬，然后分配具有FP16位精度數(shù)據(jù)

CNN硬件配置要點(diǎn)：Tensors> FLOP> 顯存> 半精度計(jì)算(FP16)

GPU可選型號(hào)：

No	型號(hào)	CUDAs	Tensors	顯存¹	顯存帶寬²	張量計(jì)算³	F16半精度⁴	F32單精度⁵
1	Quadro GV100	5120	640	32	870	133	33.32	16.66
	Quadro RTX8000	4608	576	48	672	130	32.62	16.31
	Quadro RTX6000	4608	576	24	672	130	32.62	16.31
	Titan RTX	4608	576	24	672	130	32.62	16.31
2	TITAN V	5120	640	12	651	119	29.80	14.90
	TESLA V100	5120	640	16	897	113	28.26	14.13
	RTX2080Ti	4352	544	11	616	108	26.90	13.45
3	Quadro RTX5000	3072	384	16	448	89	22.30	11.15
	RTX2080S	3072	368	8	496	85	22.30	11.15
4	TESLA T4	2560	320	16	320	65	65.13	8.14
	RTX2070S	2560	288	8	448	65	18.12	9.06
	Quadro RTX4000	2304	288	8	416	57	14.24	7.12
	RTX2060S	2176	272	6	336	57	14.36	7.18

標(biāo)注1—單位GB，標(biāo)注2—單位GB/s, 標(biāo)注3~5 ---單位TFlops

說明：

	GPU卡型號(hào)	顯存	計(jì)算規(guī)模	說明
1	RTX2070s RTX2080s RTX2080ti	8GB 8GB 11GB	小型模型開發(fā)	較小的GPU內(nèi)存占用空間，高吞吐量工作負(fù)載應(yīng)用渦輪式散熱，單臺(tái)工作站中最多配置8個(gè)
2	Titan RTX	24GB	中等模型開發(fā)	大顯存支持使用更大的批處理需要訓(xùn)練大型計(jì)算機(jī)視覺模型，TITAN RTX可以做到。最多4塊，不支持密集地裝進(jìn)工作站
3	RTX6000	24GB	中大等規(guī)模開發(fā)	配備渦輪風(fēng)扇，支持密集安裝支持單機(jī)最大9塊
4	RTX8000	48GB	超大規(guī)模	擁有所有NVIDIA GPU中最大的內(nèi)存容量，配備渦輪風(fēng)扇，支持密集安裝支持單機(jī)最大9塊

應(yīng)用2 RNN（循環(huán)神經(jīng)網(wǎng)絡(luò)）計(jì)算特點(diǎn)
這類典型應(yīng)用主要是自然語(yǔ)言處理（NLP），包括語(yǔ)音識(shí)別，語(yǔ)言翻譯，語(yǔ)音轉(zhuǎn)文本和Q＆A系統(tǒng)。

主要算法：RNN（包括變體: LSTM、GRU、NTM、雙向RNN等）、Transformer
主流框架：CNTK、Torch/PyTorch、Keras
多GPU并行計(jì)算：不明確，跟程序設(shè)計(jì)、算法、框架、SDK以及具體應(yīng)用都有很大關(guān)系，一些應(yīng)用CPU多核并行反倒更快。

RNN和LSTM的訓(xùn)練并行計(jì)算是困難的，因?yàn)樗鼈冃枰鎯?chǔ)帶寬綁定計(jì)算，這是硬件設(shè)計(jì)者的噩夢(mèng)，最終限制了神經(jīng)網(wǎng)絡(luò)解決方案的適用性。簡(jiǎn)而言之，LSTM需要每個(gè)單元4個(gè)線性層（MLP層）在每個(gè)序列時(shí)間步驟中運(yùn)行。線性層需要大量的存儲(chǔ)帶寬來計(jì)算，事實(shí)上，它們不能使用許多計(jì)算單元，通常是因?yàn)橄到y(tǒng)沒有足夠的存儲(chǔ)帶寬來滿足計(jì)算單元。而且很容易添加更多的計(jì)算單元，但是很難增加更多的存儲(chǔ)帶寬（注意芯片上有足夠的線，從處理器到存儲(chǔ)的長(zhǎng)電線等）

GPU內(nèi)存非常重要，因?yàn)橹T如XLNet和BERT之類的transformer網(wǎng)絡(luò)需要大量的內(nèi)存才能達(dá)到最高的精度，考慮矩陣乘法A*B=C的一種簡(jiǎn)單有效的方法是受內(nèi)存(顯存)帶寬限制：將A，B的內(nèi)存復(fù)制到芯片上比進(jìn)行A * B的計(jì)算要昂貴。這意味著如果您要使用LSTM和其他執(zhí)行大量小矩陣乘法的循環(huán)網(wǎng)絡(luò)，則內(nèi)存(顯存)帶寬是GPU的最重要功能。矩陣乘法越小，內(nèi)存(顯存)帶寬就越重要，介于卷積運(yùn)算和小型矩陣乘法之間的transformer在整體求解過程環(huán)節(jié)中并行效率低，加快方式提升顯存帶寬和足夠的顯存容量

RNN硬件配置要點(diǎn)：顯存帶寬+顯存> 半精度計(jì)算(FP16) > Tensors> FLOP

GPU可選型號(hào)

No	型號(hào)	CUDAs	Tensors	顯存¹	顯存帶寬 ²	張量計(jì)算³	F16半精度⁴	FP32單精度⁵
1	TESLA V100	5120	640	16	897	113	28.26	14.13
	Quadro GV100	5120	640	32	870	133	33.32	16.66
2	Quadro RTX8000	4608	576	48	672	130	32.62	16.31
	Quadro RTX6000	4608	576	24	672	130	32.62	16.31
	Titan RTX	4608	576	24	672	130	32.62	16.31
	TITAN V	5120	640	12	651	119	29.80	14.90
	RTX2080Ti	4352	544	11	616	108	26.90	13.45
3	RTX2080S	3072	368	8	496	85	22.30	11.15
	Quadro RTX5000	3072	384	16	448	89	22.30	11.15
	RTX2070S	2560	288	8	448	65	18.12	9.06
	Quadro RTX4000	2304	288	8	416	57	14.24	7.12
4	RTX2060S	2176	272	6	336	57	14.36	7.18
	TESLA T4	2560	320	16	320	65	65.13	8.14

說明

	GPU卡型號(hào)	顯存	可選	說明
1	RTX5000	16GB	Good	擁有16GB顯存，
2	Titan RTX	24GB	Better	支持NVLink橋接，加速訓(xùn)練更大的NLP網(wǎng)絡(luò)模型，
	RTX6000	24GB	Better	類似TITAN RTX性能指標(biāo)，渦輪散熱設(shè)計(jì)允許密集配置，支持單機(jī)最大9塊卡擴(kuò)展
3	Quadro GV100	32GB	Best	擁有最高的顯存帶寬870GB/s和最高的張量算力
3	RTX8000	48GB	Best	擁有最大48GB顯存，是NLP的最佳GPU 渦輪散熱設(shè)計(jì)允許密集配置，支持單機(jī)最大9塊卡擴(kuò)展

（四）深度學(xué)習(xí)計(jì)算系統(tǒng)平臺(tái)配備

4.1深度學(xué)習(xí)框架對(duì)比

框架	重點(diǎn)應(yīng)用	編程語(yǔ)言	多GPU速度	深度學(xué)習(xí)主要算法
框架	重點(diǎn)應(yīng)用	編程語(yǔ)言	多GPU速度	CNN	RNN /LTSM	GAN	RBM/ DBN
TensorFlow	自然語(yǔ)言處理，文本分類/摘要，語(yǔ)音/圖像/手寫識(shí)別，預(yù)測(cè)和標(biāo)記	Python ， C++， R語(yǔ)言	++	+++	++		支持
Caffe	視覺識(shí)別	C,C++，Python，Matlab	+	++
CNTK	手寫和語(yǔ)音識(shí)別.處理圖像	C++，Python	++	+	+++	支持
PyTorch	處理圖像，手寫和語(yǔ)音識(shí)別	CUDA，C/C++	+++	+++	++	支持	支持
MXNet	圖像，手寫/語(yǔ)音識(shí)別，預(yù)測(cè)和NLP	Python,R,C++ Julia，CUDA	+++	+++	+	支持
Chainer	情感分析，機(jī)器翻譯，語(yǔ)音識(shí)別	CUDA		支持	支持
Keras	分類，文本生成和摘要，標(biāo)記和翻譯，以及語(yǔ)音識(shí)別	Python		支持	支持
DL4J	圖像識(shí)別，欺詐檢測(cè)，文本挖掘，詞性標(biāo)記和自然語(yǔ)言處理	Java		支持	支持		支持
Theano		Python	+	++	++

4.2 深度學(xué)習(xí)開發(fā)庫(kù)SDK
開發(fā)環(huán)境：CUDA Toolkit
訓(xùn)練SDK：cuDNN （7.0版本支持Tensor Core）、NCCL、cuBLAS、cuSPARSE
推理SDK：TensorRT（版本3.0支持Tensor Core）、DALI

4.3 深度學(xué)習(xí)操作系統(tǒng)
操作系統(tǒng)：Windows 10 Pro 64位+ Ubuntu 18.04或RHEL 7.5
容器：Docker 18.06.1，NVIDIA Docker運(yùn)行時(shí)v2.0.3
容器：RAPIDS容器
#p#page_title#e#

（五）深度學(xué)習(xí)計(jì)算硬件配置推薦

打造一個(gè)快速高效的深度學(xué)習(xí)計(jì)算平臺(tái)，涉及到多方面因素：
（1）超算硬件設(shè)備-—GPU、CPU、內(nèi)存、硬盤io…
（2）深度學(xué)習(xí)算法---CNN、RNN…
（3）深度學(xué)習(xí)框架---Tensorflow、PyTorch…
（4）開發(fā)庫(kù)SDK---CUDA、cuDNN…
（5）程序設(shè)計(jì)算法優(yōu)化—-張量單元、FP16精度數(shù)據(jù)計(jì)算、針對(duì)算法SDK優(yōu)化、多卡并行優(yōu)化算法…

5.1 深度學(xué)習(xí)工作站配置推薦（科研類）
機(jī)型：UltraLAB GX380i/GT410
支持2~4塊GPU卡
配備nvidia RTX---配置張量計(jì)算單元Tensor，支持intel AVX-512

No	產(chǎn)品型號(hào)	主要配置	FP16半精度性能	顯存帶寬	顯存	理想算法	價(jià)格
1.1	GX380i 14932-SA2X	intel第9代處理器(6核@4.9Ghz )/32GB DDR4 /*2RTX2070s**/960GB SSD /4TB SATA/微塔式(2000w)/23"圖顯	36Tops	448GB/s	16GB	CNN	￥29,990
1.2	GX380i 14964-SB2X	intel第9代處理器(6核@4.9Ghz)/64GB DDR4/ *2RTX2080Ti**/1.9TB SSD/4TB SATA/微塔式(1200w)/23"圖顯	54Tops	616GB/s	22GB	CNN	￥49,990
1.3	GX380i 14964-SB2D	intel第9代處理器(6核@4.9Ghz) /64GB DDR4 / *2RTX5000**/1.9TB SSD/6TB SATA/微塔式(2000w)/23"圖顯	45Tops	448GB/s	32GB	RNN	￥69,990
1.4	GX380i 14996-SB2T	intel第9代處理器(8核4.9Ghz) /96GB DDR4 / *2Titan RTX** /1.9TB SSD/6TB SATA/微塔式(2000w)/23"圖顯	65Tops	672GB/s	48GB	CNN+ RNN	￥97,500
1.5	GX380i 15096-SB2T	intel第9代處理器(8核5.0Ghz) /128GB DDR4 /*2Quadro GV100** /960TB SSD+2TB M2.SSD /6TB SATA/微塔式(2000w)/23"圖顯	67Tops	870GB/s	64GB	RNN	￥169,990
1.6	GT410i 14664-SB4X	intel第10代至尊處理器(10核4.6Ghz) /64GB DDR4 /*4RTX2080s** /1.92TB SSD/4TB SATA/微塔式(2000W)/23"圖顯	89Tops	496GB/s	32GB	CNN	￥69,990
1.7	GT410i 14596-SB4X	intel第10代至尊處理器(12核4.5Ghz ) /96GB DDR4 /*4RTX2080Ti** /1.92TB SSD /6TB SATA/微塔式(2000W)/23"圖顯	108Tops	616GB/s	44GB	CNN	￥89,990
1.8	GT410i 145192-SC4E	intel第10代至尊處理器(12核4.5Ghz ) /192GB DDR4 /*4RTX6000**/ 3.84TB SSD/10TB SATA/微塔式(2000W)/23"圖顯	131Tops	672GB/s	96GB	CNN+ RNN	￥210,000
1.9	GT410i 142256-SC4F	intel第10代至尊處理器(18核4.2Ghz ) /256GB DDR4 /*4RTX8000**/3.84TB SSD/10TB SATA/微塔式(2000W)/23"圖顯	131Tops	672GB/s	192GB	RNN	￥330,000
1.10	GT410i 142256-SC4G	intel第10代至尊處理器(18核4.2Ghz ) /256GB DDR4/*4Qudro GV100**/3.84TB SSD /10TB SATA/微塔式(2000W)/23"圖顯	133Tops	870GB/s	64GB	RNN	￥350,000

5.2 深度學(xué)習(xí)工作站配置推薦（高性能類）
機(jī)型：UltraLAB GT410P
支持支持5~7塊GPU

No	產(chǎn)品型號(hào)	主要配置	FP16半精度性能	顯存帶寬	顯存	理想算法	價(jià)格
2.1	GT410P 14696-SB5X	intel第10代至尊處理器 (10核4.6Ghz)、96GB DDR4 /*5RTX2080s**/1.92TB SSD+6TB SATA /雙塔式(雙2000w)/27"-4K圖顯	112Tops	496GB/s	40GB	CNN	￥97,000
2.2	GT410P 14596-SB6X	intel第10代至尊處理器 (12核4.5Ghz)、96GB DDR4 /*6RTX2080s**/1.9TB SSD+ 8TB SATA /雙塔式(雙2000w)/27"-4K圖顯	134Tops	496GB/s	48GB	CNN	￥108,000
2.3	GT410P 145128-SB7X	intel第10代至尊處理器 (12核4.5Ghz)、128GB DDR4 /*7RTX2080s/1.9TB SSD+ 10TB SATA**/ /雙塔式(雙2000w)/27"-4K圖顯	156Tops	496GB/s	56GB	CNN	￥118,000
2.4	GT410P 145192-SC7X	intel第10代至尊處理器 (12核4.5Ghz)、192GB DDR4 /*7RTX2080Ti 3.84TB SSD+ 8TB SATA**/ 雙塔式(雙2000w)/27"-4K圖顯	188Tops	616GB/s	77GB	CNN	￥148,000
2.5	GT410P 145192-SC5T	intel第10代至尊處理器 (12核4.5Ghz)、192GB DDR4 /*5Titan RTX/3.84TB SSD+ 10TB SATA/雙塔式(雙2000w)/**27"-4K圖顯	163Tops	672GB/s	120GB	CNN+ RNN	￥228,000
2.6	GT410P 142256-SC7E	intel第10代至尊處理器 (18核4.2Ghz)、256GB DDR4 /*7RTX6000/3.84TB SSD+ 14TB SATA/雙塔式(雙2000w)/**27"-4K圖顯	228Tops	672GB/s	168GB	CNN+ RNN	￥370,000
2.7	GT410P 142256-SC7F	intel第10代至尊處理器 (18核4.2Ghz)、256GB DDR4 /*7RTX8000/3.84TB SSD+ 14TB SATA/雙塔式(雙2000w)/**27"-4K圖顯	228Tops	672GB/s	240GB	RNN	￥535,000

5.3 深度學(xué)習(xí)工作站配置推薦（超級(jí)類）
機(jī)型：UltraLAB GX630M）
支持8~9塊GPU

No	產(chǎn)品型號(hào)	主要配置	FP16半精度性能	顯存帶寬	內(nèi)存/顯存	理想算法	價(jià)格
3.1	GX630M 237192-MB9X	2Xeon金6234(16核3.7GHz)/ 睿頻4GHz* /192GB DDR4 /*9RTX2080s/960GB SSD+2TB M2.SSD**/28TB存儲(chǔ)/雙塔/27"-4K圖顯	201Tops	496GB/s	40GB	CNN	￥199,990
3.2	GX630M 243192-MB8X	2Xeon金6244(16核4.3GHz)/ 睿頻4.3GHz* /192GB DDR4 /*8RTX2080Ti/1.9TB SSD+2TB M2.SSD**/42TB存儲(chǔ)/雙塔/27"-4K圖顯	215Tops	616GB/s	88GB	CNN	￥245,000
3.3	GX630M 241384-60T7T	2Xeon金6246(24核4.1GHz)/ 睿頻4.2GHz* /384GB DDR4 /*7Titan RTX**/3.84TB SSD /60TB并行存儲(chǔ)/雙塔/27"-4K圖顯	228Tops-	672GB/s	168GB	CNN+ RNN	￥399,990
3.4	GX630M 241384-42T8E	2Xeon金6246(24核4.1GHz)/ 睿頻4.2GHz* /384GB DDR4 /*8RTX6000**/1.92TB SSD+2TB M2.SSD/42TB并行存儲(chǔ)/雙塔/32"-4K圖顯	261Tops	672GB/s	192GB	CNN+ RNN	￥499,990
3.5	GX630M 239768-150T8F	2Xeon金6254(36核3.9GHz)/ 睿頻4.0GHz* /768GB DDR4 /*8RTX8000**/3.84TB SSD+3.2TB P-SSD/150TB并行存儲(chǔ)/雙塔/32"-4K圖顯	261Tops	672GB/s	384GB	CNN+ RNN+ 推理	￥750,000
3.6	GX630M 235768-210T8G	2Xeon白金8268(48核3.5GHz)/睿頻3.9GHz* /768GB DDR4 /*8QGV100 /3.84TB SSD /6.4TB P-SSD**/210TB并行存儲(chǔ)/雙塔/32"-4K圖顯	266Tops	870GB/s	256GB	CNN+ RNN+ 推理	￥850,000
3.7	GX630M 2331T-266T9F	2Xeon白金8280(56核3.3GHz/ 睿頻4.0GHz* /1TB DDR4 /*9RTX8000/3.84TB SSD系統(tǒng)盤/6.4TB P-SSD/266TB**并行存儲(chǔ)/雙塔/32"-4K圖顯	293Tops-地球最強(qiáng)	672GBs	432GB	CNN+ RNN+ 推理	￥999,990

UltraLAB圖形工作站供貨商：
西安坤隆計(jì)算機(jī)科技有限公司
國(guó)內(nèi)知名高端定制圖形工作站廠家
業(yè)務(wù)電話：400-705-6800

咨詢微信號(hào)：

關(guān)閉此頁(yè)

上一篇：機(jī)器夜間識(shí)別 HADAR技術(shù)的研究利器—高速計(jì)算設(shè)備配置推薦

下一篇：6塊RTX3090Ti+靜音級(jí)--完美深度學(xué)習(xí)工作站配置方案

一级毛片aaaaaa视频免费看|超人碰碰碰人人成碰人|一边吃奶一边扎下边爽了,亚洲欧美日韩中文高清一,真实破99年美女的处,欧美精品18videose×性欧美

深度學(xué)習(xí)訓(xùn)練與推理計(jì)算平臺(tái)硬件配置完美選型2020v1

相關(guān)文章

工程技術(shù)(工科)專業(yè)工作站/服務(wù)器硬件配置選型

新聞排行榜

最新信息

應(yīng)用導(dǎo)航: