NVIDIA副總Walter談專業(yè)卡技術(shù)及行業(yè)客戶應(yīng)用狀況
NVIDIA Quadro 專業(yè)顯卡推動(dòng)了索尼電影公司所屬的Imageworks公司在最新的所有CG動(dòng)作電影中的創(chuàng)意工作。
如何能夠運(yùn)用技術(shù)手段將已有1200年歷史的古老史詩中描述的英雄、妖怪和巨龍?jiān)佻F(xiàn)在人們的眼前?這個(gè)問題就是導(dǎo)演Robert Zemeckis與索尼電影公司所屬的Imageworks公司(索尼Imageworks)在將《Beowulf(戰(zhàn)狼)》的故事搬上銀幕的過程中所面臨的挑戰(zhàn)。
Zemeckis 與索尼Imageworks的工作團(tuán)隊(duì),使用了曾在《The Polar Express(極地特快)》中首次使用,并在《Monster House(怪獸屋)》中再次使用的“表演捕捉技術(shù)”,來講述英雄Beowulf(由Ray Winstone飾演)的故事。在這個(gè)故事中,Beowulf 來到Hrothgar國王(Anthony Hopkins 先生)的議事大廳,殺死長期以來一直為Hrothgar的王國制造苦難和災(zāi)難的妖怪 Grendel(Crispin Glover)。然而,在處決Grendel之后, Beowulf 就必須面對(duì)Grendel的母親(Angelina Jolie)因?yàn)閱首又炊貙⒉扇〉寞偪駨?fù)仇行動(dòng)。這個(gè)故事改編自被認(rèn)為是英國文學(xué)首部巨著的恢宏史詩。
“表演捕捉”運(yùn)用了演員的身體運(yùn)動(dòng)和面部表情的相關(guān)追蹤技術(shù),然后將收集到的相關(guān)數(shù)據(jù)用于根據(jù)演員的表演創(chuàng)建動(dòng)畫場(chǎng)景。 影片《Beowulf(戰(zhàn)狼)》 的超常規(guī)模是這部作品的制作過程中遭遇的一個(gè)獨(dú)特挑戰(zhàn)。有些場(chǎng)景的人物角色達(dá)到了70多個(gè),每個(gè)演員的動(dòng)作都必須進(jìn)行精準(zhǔn)捕捉、跟蹤,并且需要將其放置融入到動(dòng)畫角色的身上。然后再應(yīng)用紋理和照明效果,從而在攝影機(jī)布局過程中能夠讓導(dǎo)演實(shí)現(xiàn)實(shí)時(shí)互動(dòng)。
這種新的預(yù)覽技術(shù)增加了額外的相關(guān)挑戰(zhàn)。傳統(tǒng)的預(yù)覽技術(shù)使用簡單的、非紋理性幾何學(xué)來設(shè)置或計(jì)劃攝影機(jī)、演員和場(chǎng)景中動(dòng)作的所處位置。但是對(duì)于《Beowulf(戰(zhàn)狼)》這部影片來說,電影制作人員和索尼Imageworks的工作團(tuán)隊(duì)需要完成更多的工作。他們需要一種能夠表明情緒、照明細(xì)節(jié)和場(chǎng)景基調(diào)的預(yù)覽程序。 因此,就需要實(shí)現(xiàn)和達(dá)到與頂級(jí)視頻游戲效果相類似的較高畫面質(zhì)量,而找到能夠應(yīng)對(duì)制作出實(shí)時(shí)高質(zhì)量畫面挑戰(zhàn)的顯卡產(chǎn)品才是解決這個(gè)問題的訣竅?!禕eowulf(戰(zhàn)狼)》的工作團(tuán)隊(duì)在NVIDIA的 Quadro專業(yè)顯卡產(chǎn)品家族中找到了他們理想的產(chǎn)品,這種顯卡可以提供對(duì)多個(gè)角色進(jìn)行紋理和照明實(shí)時(shí)渲染所需的處理動(dòng)力。憑借Quadro™解決方案,影片導(dǎo)演可在調(diào)度、拍攝和更改表演的實(shí)時(shí)進(jìn)程中,獲得自己需要的及時(shí)性反饋。
“Quadro顯卡具備生產(chǎn)我們?cè)诒硌莶蹲郊珊蛿z影機(jī)布局過程中所需要的實(shí)時(shí)場(chǎng)景能力。” 《Beowulf(戰(zhàn)狼)》的動(dòng)畫技術(shù)主管——Corey Turner 這樣說道。“我們有些場(chǎng)景非常復(fù)雜,有時(shí)需要對(duì)70多個(gè)角色的動(dòng)作進(jìn)行實(shí)時(shí)編輯和渲染, NVIDIA賦予了我們實(shí)時(shí)展示導(dǎo)演想法的能力。”
通過將Quadro專業(yè)圖形顯卡集成到他們創(chuàng)意作品之中,索尼Imageworks的工作團(tuán)隊(duì)實(shí)現(xiàn)了對(duì)復(fù)雜性很高的動(dòng)作場(chǎng)景的實(shí)時(shí)排列和渲染。工作人員們遇到的最為重大的挑戰(zhàn)之一就是Grendel在Hrothgar的議事大廳遭到攻擊的場(chǎng)景。這個(gè)場(chǎng)景的出鏡角色有70多個(gè),還要由一臺(tái)移動(dòng)攝影機(jī)在大廳內(nèi)拍攝整個(gè)過程,Zemeckis在所有數(shù)據(jù)都已在實(shí)時(shí)3D 場(chǎng)景中進(jìn)行集成之后,決定了攝影機(jī)的拍攝位置以及表演動(dòng)作如何做出。盡管在所有表演中,最終只有一小部分可以在攝像機(jī)的拍攝范圍內(nèi),不過,Quadro顯卡能夠讓導(dǎo)演在決定最終拍攝機(jī)位之前,對(duì)所有的角色進(jìn)行排列布局和渲染操作。
《Beowulf(戰(zhàn)狼)》這部影片的制作過程一直在挑戰(zhàn)Quadro顯卡的性能表現(xiàn)極限 。最具挑戰(zhàn)性的拍攝之一是一段107秒的場(chǎng)景拍攝過程,在這個(gè)場(chǎng)景中,將近60個(gè)角色開始的時(shí)候在議事大廳跳舞,然后,這些角色的活動(dòng)地點(diǎn)又轉(zhuǎn)移到了議事大廳的房頂上面 ,隨后他們又穿過了四英里的鄉(xiāng)間小路,最后,拍攝工作在Grendel的洞穴中結(jié)束。由于需要對(duì)演員、道具進(jìn)行實(shí)時(shí)的完全照明和紋理渲染,所以,該項(xiàng)拍攝工作分為三個(gè)實(shí)時(shí)預(yù)覽片段進(jìn)行,然后再共同進(jìn)行回放編輯工作。然而,Zemeckis仍然能夠?qū)⑵渫昝赖剡M(jìn)行視覺演繹和展示,最后的成片中,整個(gè)拍攝工作看上去非常流暢完整、無懈可擊。
#p#page_title#e#
第2頁:NVIDIA專業(yè)圖形解決方案高端論壇——Walter演講(上)
時(shí) 間:2008年1月17日
地 點(diǎn):北京麗思卡爾頓酒店酒店 大宴會(huì)廳
Walter Mundt-Blum:首先歡迎大家來參加我們的論壇,同時(shí)我也非常感謝大家對(duì)我們的產(chǎn)品特別是專業(yè)產(chǎn)品感興趣。我想向大家解釋一下我們公司是做什么的,有一些產(chǎn)品可能大家以前不知道,其實(shí)我們還做這個(gè)。我相信中國用戶對(duì)我們公司是非常了解的,我們有很多游戲方面的產(chǎn)品,甚至很多人給我們發(fā)來自己創(chuàng)作的NVIDIA相關(guān)藝術(shù)產(chǎn)品,包括照片等等的東西,比如說有人在雪上做了一個(gè)我們的LOGO。感謝他們對(duì)NVIDIA公司的巨大熱情。最有意思的是我們可以看這個(gè)小孩子的臉,這是來自歐洲的一張照片,他們的父母為問我們是不是可以把這個(gè)小姑娘起名為NVIDIA呢?我們對(duì)此沒有任何否定意見,還有其他的照片,比如說西瓜上有我們的LOGO等等。
很多人都知道我們?cè)谟螒蝾I(lǐng)域做出了很大的貢獻(xiàn)。那現(xiàn)在我們講一下我們?cè)趯I(yè)領(lǐng)域做哪些東西。我們這次過來主要希望向大家介紹兩個(gè)產(chǎn)品:一個(gè)是Tesla和CUDA,是我們公司推出的高性能計(jì)算的產(chǎn)品;另外一個(gè)是Quadro,我會(huì)來主講這方面的技術(shù)產(chǎn)品。
『NVIDIA專業(yè)解決方案事業(yè)部全球銷售副總裁Walter先生向參會(huì)媒體朋友介紹CUDA及專業(yè)顯卡產(chǎn)品』
在Tesla和CUDA這方面中,我們的GPU不在是負(fù)責(zé)圖形方面的工作,而是用在視覺計(jì)算。而在面向圖形方面的專業(yè)解決方案中,我們也不僅有板卡還有系統(tǒng)。比如說桌面系統(tǒng),還有服務(wù)器的環(huán)境等等。換句話說,NVIDIA可以做很大的系統(tǒng),不僅僅是一種普通的顯卡。
通過這張圖表我們可以看到,在工作站的整個(gè)發(fā)展過程當(dāng)中,我們所發(fā)售的GPU的數(shù)量比其他公司的產(chǎn)品總和還要多。同時(shí)這里有一個(gè)趨勢(shì)圖,2007年大家可以看到這是第三季度,而到2007年第四季度末我們?cè)趯I(yè)市場(chǎng)80%至85%的市場(chǎng)份額。如果把所有的產(chǎn)品加起來超過了所有其他競(jìng)爭(zhēng)對(duì)手同類產(chǎn)品的總和,從這點(diǎn)來說,我們?nèi)〉昧司薮蟮某删汀.?dāng)然這些成就的得來,也要非常感謝中國的市場(chǎng),因?yàn)楸M管我們進(jìn)入中國時(shí)間非常短,在專業(yè)產(chǎn)品上僅僅兩年時(shí)間,我們已經(jīng)取得了很大的進(jìn)步。但是在國內(nèi)杰出的藝術(shù)創(chuàng)作中,90%都用到了NVIDIA GPU的設(shè)計(jì)。另外,我們的應(yīng)用領(lǐng)域也非常多,比如像空中客車A380,在我接下來的DCC演講部分當(dāng)中可以給大家看到,空中客車有一個(gè)超大的屏幕,是1:1的比例制作的。人們可以時(shí)時(shí)看到到底內(nèi)部的設(shè)計(jì)是什么樣,他們甚至可以走進(jìn)去,而這就要?dú)w功于我們的Quadro解決方案。還有蘭博基尼,還有阿迪達(dá)斯,可以讓他們看到這個(gè)鞋設(shè)計(jì)出來到底是什么樣子,產(chǎn)生時(shí)時(shí)的圖形。還有比如像歐寶,他們有汽車使用系統(tǒng),通過這個(gè)系統(tǒng)歐寶可以提供比之前多27%的設(shè)計(jì)樣式。一年前,他們本來打算只有200個(gè)終端的建設(shè),而現(xiàn)在有600個(gè)。保時(shí)捷也采用我們的產(chǎn)品進(jìn)行設(shè)計(jì),還有其他公司有類似的做法,所以大家會(huì)看到越來越多的公司會(huì)用我們的產(chǎn)品做汽車的配置。
我們這個(gè)技術(shù)不僅僅是用于制造業(yè),而且也非常重要的在電視行業(yè),比如說我們有一個(gè)SDI的產(chǎn)品。大家看一下這邊的奧林匹克的滑冰,大家可以看到,實(shí)際上背后這個(gè)東西是由電腦計(jì)算機(jī)時(shí)時(shí)制作出來的,大家可以看到隨著這個(gè)人的出現(xiàn),相應(yīng)的計(jì)算機(jī)技術(shù)制作出來會(huì)變化。而正因?yàn)槿绱?,我們獲得了艾美獎(jiǎng),這是我們的CEO黃仁勛先生領(lǐng)取艾美獎(jiǎng)。還有在中國我們也知道有一個(gè)紀(jì)錄片叫《圓明園》,這是一個(gè)數(shù)字紀(jì)錄片,在中國是最大的一部數(shù)字紀(jì)錄片。也許我們可以看這個(gè)記錄片的一些視頻。
所有這些影像都是數(shù)字制作的,不是真的東西,我也非常高興請(qǐng)到了《圓明園》的導(dǎo)演金先生,下面我們請(qǐng)他來向我們解釋一下,他們是如何使用NVIDIA技術(shù)制作這么好的紀(jì)錄片。
金鐵木:各位大家好!《圓明園》這部分電影大概有人看過,在北京播了很長時(shí)間,其實(shí)從藝術(shù)的角度來講電影,電影需要技術(shù)的支持,我其實(shí)在技術(shù)方面屬于門外漢,非常不懂。但是在中國所有導(dǎo)演中,我一直致力于數(shù)字技術(shù)的,換句話說,我做的影片,有一大部分是要再現(xiàn)歷史,重現(xiàn)歷史,《圓明園》就是這樣的一部電影,沒有數(shù)字技術(shù)就沒有《圓明園》。
『電影《圓明園》導(dǎo)演金鐵木先生介紹電影編輯中采用NVIDIA專業(yè)顯卡的成功經(jīng)歷』
在電影中,我們最基本的要求在圖象處理方面我們而需要2K的技術(shù),現(xiàn)在我們?cè)谧?K的電影,明年我們就要做6K的電影,現(xiàn)在我們?cè)谧鰥W運(yùn)會(huì)的開幕式及我們?cè)诙嗝襟w演示方面有8K的要求,這樣的要求對(duì)專業(yè)的圖形處理技術(shù)要求高,越來越高。所以,我覺得有了像NVIDIA這樣的公司,有了這樣的技術(shù),有了這樣的專業(yè)的團(tuán)隊(duì)致力于這方面的開發(fā),我們?cè)趯I(yè)的電影影像方面才有可能。我們運(yùn)算的能量,運(yùn)算最后達(dá)到的效果,才會(huì)達(dá)到我們所需要的,因?yàn)殡娪白詈蠖际且o觀眾看的,電影是NVIDIA這種圖形處理技術(shù)是通向觀眾的橋梁。我其實(shí)不是非常了解,我做技術(shù)的團(tuán)隊(duì)告訴我,說NVIDIA是業(yè)界最好的他們是做的最大的。希望NVIDIA做的越來越好,我們講做6K、8K電影的時(shí)候,希望NVIDIA的技術(shù)會(huì)讓我們更輕松。謝謝大家!
Walter Mundt-Blum:謝謝您,雖然我不能理解你說的東西,可以說是什么也不懂,但是我相信我們合作的還是非常不錯(cuò),謝謝您!除了電影之外,我們同時(shí)也在垂直市場(chǎng)方面也非常知名,其中有一個(gè)就是在軍事技術(shù)方面,航空技術(shù)方面的GPU的技術(shù)。比如說向模擬系統(tǒng),還有戰(zhàn)斗機(jī),還有頭盔上面的攝像頭等等,我們的GPU也在用在這里面。
如果在設(shè)計(jì)產(chǎn)品,基本上希望在進(jìn)行生產(chǎn)之前,就知道到底它看上去怎么樣,它的功能怎么樣。如果不能模擬就會(huì)浪費(fèi)很多的時(shí)間和資源,這里有四個(gè)小例子??梢越o大家一些印象我們到底跟我們的合作伙伴做哪些東西。這是空中客車,這是3D的虛擬化空間,到處都是投影機(jī),上面、下面、后面都是投影機(jī),這些投影機(jī)會(huì)投出3D的影像,你需要戴上3D的眼鏡進(jìn)這個(gè)房間,你感覺在這個(gè)房間里面,空中客車就設(shè)計(jì)了這樣一個(gè)空間,他的空間非常大。比如向新加坡航空公司,或者漢莎,他們就會(huì)到空中客車總部訪問,這時(shí)候空中客車就會(huì)向這些經(jīng)理人來展示和模擬新產(chǎn)品。
保時(shí)捷也在采用我們的技術(shù),例如用尾燈的設(shè)計(jì),保時(shí)捷用了RTT的產(chǎn)品,其中用到了我們的GPU,這是尾燈的設(shè)計(jì)。由于他們不希望進(jìn)行實(shí)物模型的制作,通過這種模擬就省了他們50萬美元的設(shè)計(jì)經(jīng)費(fèi)。因?yàn)橥麄兿M枰?—5個(gè)不同的設(shè)計(jì),以往他們需要實(shí)物模型,而現(xiàn)在已經(jīng)徹底數(shù)字化了。
還有大眾,大家可能也知道,上海大眾在國內(nèi)的知名度,大眾有超大的屏幕,不僅僅是來模擬設(shè)計(jì),同時(shí)還可以來模擬駕駛,比如說在設(shè)備和人之間的距離是多少,甚至是生產(chǎn)也可以進(jìn)行模擬。右下角這張圖,人們正在模擬制造一些維修,比如說你把這個(gè)車拿過來,發(fā)動(dòng)機(jī)在里面,而你在進(jìn)行維修的時(shí)候,你要換引擎,可能需要保證不需要?jiǎng)悠渌臇|西,就可以來對(duì)它進(jìn)行更換等等。所以,人們?cè)谟梦覀兊募夹g(shù)時(shí)更快的可以投入市場(chǎng),并且也可以節(jié)省他們的資金。
在不久的將來,汽車導(dǎo)航系統(tǒng)不僅能幫他們導(dǎo)航,要到達(dá)他們想要到的目的地,同時(shí)也可以幫助人們,因?yàn)橄到y(tǒng)可以看,同時(shí)可以識(shí)別東西,待會(huì)兒Andy Keane會(huì)講到GPU計(jì)算,會(huì)講到GPU不僅僅是幫助顯示還有其它的用途。在這里我們可以看到,我們?cè)谲嚴(yán)镅b了GPU,你可以看到左邊有兩張圖,一張是車前面真正的機(jī)井,另外可以看到下面西門子授權(quán)的一個(gè)設(shè)計(jì),前面裝了一個(gè)攝像機(jī),真正來捕捉這些圖像,通過我們的導(dǎo)航系統(tǒng),在屏幕上放一個(gè)箭頭,這樣就知道朝著前頭走。在右上角有儀表盤的設(shè)計(jì),就是說在這不再是一種模擬的儀表盤,而是采用了全新的技術(shù)。這個(gè)數(shù)字儀表盤采用了比較高的分辨率,大概有1000—2000像素。而且你可以不斷地把功能來回的調(diào)換,有的時(shí)候你可以調(diào)成儀表,同時(shí)想換的時(shí)候,比如說想看一下你們前面攝像機(jī)設(shè)一些鏡頭和圖片的話可以調(diào)換。
#p#page_title#e#
第3頁:NVIDIA專業(yè)圖形解決方案高端論壇——Walter演講(下)
看下面這張圖上你可以看到這是一個(gè)新的技術(shù),這個(gè)技術(shù)也是在美國開發(fā)的,這個(gè)技術(shù)能夠幫助我們捕捉一些圖像,之后把圖像改成數(shù)碼的,它甚至能夠做一些警報(bào)系統(tǒng),假設(shè)顏色變紅的話,你可以看到前面可能有一些障礙物越來越近了,總的來說是一個(gè)比較好的預(yù)警系統(tǒng)。
我們?cè)谲嚴(yán)锩孀鲆恍〨PU,不僅在設(shè)計(jì)上,還有內(nèi)飾也會(huì)應(yīng)用到GPU的技術(shù)。另外跟圖形無關(guān)的高性能計(jì)算領(lǐng)域,GPU也有比較好的應(yīng)用,接下來我給大家介紹一下我們?cè)谶@方面的市場(chǎng)情況。
這張圖能夠讓大家非常容易的理解,可以看到運(yùn)輸界的高速提升,或者說吞吐量的高速提升,你可以看一下,之前大家使用航船來進(jìn)行交通,就是藍(lán)色線表現(xiàn)的階段,然后開始使用其他的交通工具。對(duì)于航船的速度提升是非常緩慢的,不是說一下子提升起來。你可以做一個(gè)航船的運(yùn)輸之后,兩個(gè)三個(gè)甚至可以加兩個(gè)…,太平洋、大西洋的運(yùn)輸。但是蒸汽輪船的發(fā)明將跨大西洋航行時(shí)間減少到了兩個(gè)星期,最短的時(shí)間可以接近一個(gè)星期。到了飛機(jī)被發(fā)明的時(shí)候,跨大西洋的航行在畫下了一個(gè)篇章。
對(duì)數(shù)據(jù)處理能力來說,你只用CPU來做數(shù)據(jù)處理可以看到,它的浮點(diǎn)的增長數(shù)比較點(diǎn),所以人們之前用CPU進(jìn)行計(jì)算的時(shí)候,在絕對(duì)計(jì)算速度而言并不是很好,而當(dāng)人們使用CPU做其他的工作,并沒有真正用于計(jì)算。但是隨著時(shí)間的流失,GPU的運(yùn)算功能被發(fā)掘出來,比如說運(yùn)用化學(xué)領(lǐng)域,機(jī)損化學(xué)領(lǐng)域,以前需要花6天的時(shí)間做一些數(shù)據(jù)處理,現(xiàn)在不到30分鐘就可以處理了。對(duì)于神經(jīng)建模來說,如果只用CPU進(jìn)行出具處理得話,大概需要花2.7天的時(shí)間,現(xiàn)在用GPU只需要30分鐘。對(duì)于無線射頻模擬來說,以前要8小時(shí)的時(shí)間做模擬,模擬無線射頻,現(xiàn)在只需要13分鐘都不到的時(shí)間模擬。你可以看到浮點(diǎn)增長的速度隨著GPU技術(shù)的出現(xiàn)得到了很大的改進(jìn)。
我們不僅僅把這個(gè)技術(shù)應(yīng)用于工業(yè)領(lǐng)域,包括設(shè)計(jì)車內(nèi)的內(nèi)飾,同時(shí)我們也做一些醫(yī)學(xué)上的應(yīng)用。
你可以看到這張圖,大家看到的是超聲波對(duì)嬰兒胚胎的掃描,現(xiàn)在的掃描結(jié)果中我看不清也看不明白孩子在哪兒,如果你用我們的技術(shù),可以真正的重現(xiàn)3D、2D的圖形,通過掃描就可以實(shí)現(xiàn),這樣你可以看到體內(nèi)的嬰兒可以長什么樣子。你可以看到,通過GPU技術(shù),你可以做3D、2D的轉(zhuǎn)換。我們?cè)卺t(yī)學(xué)領(lǐng)域可以在很多領(lǐng)域看到GPU的使用,不僅是圖像的使用,包括計(jì)算。
地質(zhì)學(xué)家也在這個(gè)領(lǐng)域進(jìn)行了一些分析,因?yàn)樗麄円幚淼脭?shù)據(jù)非常大,甚至有的時(shí)候會(huì)使用T字節(jié)級(jí)的數(shù)據(jù)進(jìn)行分析,看一下對(duì)石油的勘探來說,他們目前在使用我們的技術(shù),比如說可以看到,你們通過對(duì)地面的一些探測(cè)的顯示,可以看到不同的層,搜集不同的數(shù)據(jù),數(shù)據(jù)量比較大,假設(shè)用CPU計(jì)算可以花幾個(gè)月的時(shí)間處理這些數(shù)據(jù),但是通過使用GPU,實(shí)際上速度要提高17—20倍左右,假設(shè)你用一個(gè)GPU的話,可能得使用20個(gè)CPU,所以GPU的功能要更為強(qiáng)大,尤其對(duì)數(shù)據(jù)處理來說。如果你要處理大量的數(shù)據(jù),GPU可能是你選擇的技術(shù)。
在金融領(lǐng)域也是如此,在股票交易上GPU計(jì)算技術(shù)經(jīng)常會(huì)被使用,比如說人們要進(jìn)行金融風(fēng)險(xiǎn)的分析,這個(gè)時(shí)候可以用CPU來做一些分析,在GPU上面做數(shù)據(jù)分析,比如說每一次在GPU可以做15萬字的齊全模擬,非常精準(zhǔn)和高效。
另外一個(gè)非常有趣的領(lǐng)域就是GPU能夠使機(jī)器有一些認(rèn)知能力,比如說能看能聞,像狗能夠聞到癌細(xì)胞一樣。我們?cè)诿绹埠鸵患液腺Y公司進(jìn)行合作,做了一些分析,而且記錄出電腦的反應(yīng)情況。同時(shí)他們也開始對(duì)嗅覺進(jìn)行一些分析和模擬,模擬大腦的反映,他們用GPU的技術(shù)來教電腦來探來聞,所以我想在幾年之后我們將會(huì)看到他們的一些研究和制作成果。也就是說電腦可以真正來聞一些東西。
我們?cè)趺礃幽軌蚋献钚碌募夹g(shù)呢?為什么要將Quadro產(chǎn)品應(yīng)用在這些領(lǐng)域呢?Quadro實(shí)際上在設(shè)計(jì)產(chǎn)品方面有一些獨(dú)特的優(yōu)勢(shì)滿足我們客戶的有一些獨(dú)特需求,我們需要對(duì)他們的需求做定制的一些設(shè)計(jì)。比如像空客,還有一些其他的航空公司,他們?cè)诓煌碾娔X中使用同步鎖向,比如說SDI可以應(yīng)用電腦影片制作,Quadro Plex可以在PC上進(jìn)行高性能的GPU的應(yīng)用,我們希望能夠覆蓋一些城市設(shè)計(jì)的需求。就性能而言,我們優(yōu)化了Quadro,假設(shè)你看一下芯片,Quadro的芯片和其它GeForce的芯片基本上類似,但是在內(nèi)部有更多的晶體管,這樣你可以對(duì)Quadro做一些簡單的設(shè)計(jì),把一些高級(jí)的原件進(jìn)行實(shí)效分析,和專業(yè)的應(yīng)用相比,Quadro的性能比較好,而且更為穩(wěn)定一些。
另外我們還和一些公司合作,來引證和驗(yàn)證相關(guān)的產(chǎn)品,比如說Autodesk,Adobe,這些公司對(duì)我們的驅(qū)動(dòng)進(jìn)行測(cè)試,同時(shí)給我們驅(qū)動(dòng)和硬件進(jìn)行認(rèn)證,但是對(duì)GeForce來說不太了解,所以不能進(jìn)行認(rèn)證和驗(yàn)證,他們的生產(chǎn)周期比較長,所以在Quadro中整個(gè)產(chǎn)品組合比較多,GeForce主要使用娛樂領(lǐng)域,速度是非常重要的,Quadro和它不一樣,GeForce速度有10%的變化,但是Quadro在啟動(dòng)24小時(shí)內(nèi)隨著時(shí)間功能會(huì)增加。
看一下GPU,比較一下Quadro和GeForce的性能比較和基本設(shè)計(jì)上的區(qū)別,你可以看到從這個(gè)垂直應(yīng)用角度來說,Quadro的性能是GeForce的5倍,尤其是它通過Shader Model 4.0、OpenGL和DX10,進(jìn)行了性能加速的提高,我們更多關(guān)注垂直市場(chǎng),我們也和很多的公司客戶進(jìn)行聯(lián)系,包括國內(nèi)的一些大的公司,比如說浦東發(fā)展建設(shè)銀行,發(fā)展建設(shè)公司等等。還有很多大的客戶,我們也征求他們的需求,比如說你們未來6個(gè)月、12個(gè)月、24個(gè)月的需求是什么,我們把這些信息搜集起來給我們的設(shè)計(jì)人員作為參考。之后我們需要12—18個(gè)月的時(shí)間進(jìn)行設(shè)計(jì)這些產(chǎn)品,目前客戶有很多問題,我們可以幫他們解決這些問題,比如說給他們提供我們的獨(dú)立軟件供應(yīng)商還有我們的硬件合作商,包括聯(lián)想、HP,和他們一起幫助我們的客戶解決問題。
同時(shí),我們也在教育我們的客戶,希望今年我們能夠把客戶教育的體系擴(kuò)展到中國,我們通過垂直市場(chǎng),包括奧林巴斯,還有和其他的一些合作伙伴建立合作伙伴關(guān)系,同時(shí)也通過一些圓桌會(huì)議進(jìn)行討論,比如去年在德國大概有140名非常關(guān)鍵的IT人物在圓桌會(huì)議上跟我們共享了一些技術(shù)信息。
眼見為實(shí),接下來我給大家放兩段小片子,給大家介紹一下目前通過我們的技術(shù)能夠做一些什么樣的事情。第一個(gè)關(guān)于實(shí)時(shí)光線追蹤的,在一年前需要200個(gè)或者是400個(gè)CPU做實(shí)時(shí)光線追蹤,現(xiàn)在只用一個(gè)系統(tǒng)就可以做。比如說看一下(蘭博基尼)的例子,這是一個(gè)(蘭博基尼)的車,這里面有反光鏡的影子,但是沒有真正的反射,但是你可以看到電腦在做一些計(jì)算,看一看反射的結(jié)果,你可以看到它從反光鏡里面做一些反射的計(jì)算,同時(shí)也做一系列的相關(guān)的計(jì)算,所以你可以看到以實(shí)時(shí)的方式能夠看到這些光線。這是通過一些追蹤的技術(shù)在進(jìn)行改進(jìn),你可以看尾燈,保時(shí)捷當(dāng)時(shí)憑借對(duì)實(shí)時(shí)的追蹤,希望能夠?qū)ξ矡暨M(jìn)行光線追蹤,現(xiàn)在你可以通過這個(gè)技術(shù),可以看到實(shí)時(shí)的尾燈光線追蹤,這個(gè)地方也一樣,這種實(shí)時(shí)的追蹤能夠給你一種更好的感知,在模擬過程中能夠更好的了解產(chǎn)品設(shè)計(jì)的結(jié)果是什么樣。
接下來就是一種提升的技術(shù),這個(gè)提升的技術(shù)是什么,由于我有一個(gè)視頻,同時(shí)又一些3D的技術(shù)在一起,我們對(duì)RTT也做了一些研究,就是對(duì)實(shí)際的車輪的輪胎設(shè)計(jì)做了一些研究。你可以看到,這是攝像機(jī)把整個(gè)輪胎拍攝下來,在里面你可以看到有一些標(biāo)志點(diǎn),這些標(biāo)志點(diǎn)被電腦使用。這個(gè)輪胎是真的,但是里面的輪轂是一個(gè)3D的制作,大家可以看到里面的反射,外面是真的,但是里面是3D的,這樣大家可以看到實(shí)時(shí)的輪胎在轉(zhuǎn)動(dòng),到底設(shè)計(jì)在里面是怎么反映的。這個(gè)看上去已經(jīng)不錯(cuò)了,但是我們?cè)偌由系诙€(gè)像機(jī)在這里,它可以由計(jì)算機(jī)來反映的是一個(gè)光源在上面反射的狀況,所以大家可以看到,實(shí)際上我們公司進(jìn)入的領(lǐng)域是很多人不知道我們所在的領(lǐng)域,很多人只知道我們?cè)谟螒蚍矫孀龅姆浅2诲e(cuò),我希望大家能夠把這些訊息傳達(dá)給你們的同事們還有其他人。就是NVIDIA不僅僅是做游戲產(chǎn)品的。
謝謝大家!希望大家今天過的愉快,而且我們?cè)诮裉靵淼姆謺?huì)場(chǎng)希望能夠再次看到大家
#p#page_title#e#
第4頁:NVIDIA媒體圓桌會(huì)——Walter演講(上)
時(shí) 間:2008年1月17日(13:30—15:00)
地 點(diǎn):北京麗思爾頓酒店
魏鳴:謝謝大家下午又回來這里,今天很多內(nèi)容要裝到腦子里,我們?cè)谏衔缭赪alter的主題演講里面,從更高的層面來講專業(yè)圖形解決方案對(duì)行業(yè)的影響對(duì)人生活的影響,下午有一些媒體,我們想更細(xì)的介紹一下Walter的解決方案,這個(gè)產(chǎn)品的特點(diǎn),架構(gòu)是什么。所以下午注重技術(shù)型,同時(shí)也會(huì)講在某些垂直行業(yè)我們?yōu)槭裁醋龅暮?,為什么在這個(gè)市場(chǎng)里占有率是80%,我們是怎么做的這么深的,所以從這幾方面具體的解釋一下。他先有一個(gè)PPT的演講,然后是媒體問答。
Walter:首先介紹一下我自己,大家可能從我的名字也能看出,我并不是美國人我是德國人,但是我在美國工作,我在NVIDIA工作了7年,我之前在艾爾莎這個(gè)公司負(fù)責(zé)銷售和執(zhí)行總裁。在2000年的時(shí)候,雖然艾爾莎是最早在用NVIDIA的東西做工作站的產(chǎn)品,在那年也是NVIDIA收購了艾爾莎這個(gè)公司所有相關(guān)的資產(chǎn),并且把開發(fā)人員也帶到了NVIDIA公司。
在之前我們只有Quadro和GeForce這兩個(gè)產(chǎn)品線,也可以說是兩個(gè)品牌,現(xiàn)在也就是9月之前我們推出了Tesla,大家早上已經(jīng)聽到了,我們現(xiàn)在已經(jīng)有了三個(gè)針對(duì)不同市場(chǎng)的三個(gè)產(chǎn)品線。GeForce主要是在娛樂游戲這塊兒的,Quadro主要是在專業(yè)DCC,還有垂直市場(chǎng)這塊兒,數(shù)字內(nèi)容創(chuàng)建等。Tesla主要在計(jì)算這塊兒,早上我同事跟大家介紹了有關(guān)Tesla這塊兒,下午我主要講Quadro這部分。
實(shí)際上我們可以看到這三個(gè)不同的產(chǎn)品線,它們不僅僅是品牌不同,而且芯片相關(guān)的技術(shù)也不一樣,相比較Tesla和GeForce,我們Quadro產(chǎn)品應(yīng)該說更超級(jí)的硬件的組合,因?yàn)槔锩嬗袑iT是用于OpenGL,還有一些專用的不同的驅(qū)動(dòng),同時(shí)也支持AutoCAD。
這張圖上(PPT)大家可以看到有關(guān)Quadro的相關(guān)數(shù)字,我們?cè)贜VIDIA,加起來有15000人年的專業(yè)GPU經(jīng)驗(yàn),到個(gè)月底,也就是說到我們這個(gè)財(cái)年接觸我們能夠出貨的針對(duì)專業(yè)級(jí)的GPU是1200萬套,看到我們這個(gè)數(shù)字是1200萬套,而所有其他的競(jìng)爭(zhēng)對(duì)手在這個(gè)專業(yè)領(lǐng)域的SGI,所有加起來的整個(gè)出貨量都不達(dá)不到我們這個(gè)數(shù)字。我們總的研發(fā)費(fèi)用每年是 10億美元,這里不僅僅指Quadro產(chǎn)品,其實(shí)也包括其他的GPU產(chǎn)品,還包括媒體、通信、處理器等等,所有加在一起是10億美元的研發(fā)費(fèi)用。正是由于我們這種研究的能力,我們的投入,我們的支持,我們確信我們公司在相關(guān)的工作站的處理器是最優(yōu)秀的。再看一下我們的專業(yè)團(tuán)隊(duì),專門進(jìn)行專業(yè)領(lǐng)域的解決方案開發(fā)的工程人員有200名,包括在美國東西海岸,包括在德國、印度,可以說我們這些工程是地理方面區(qū)域分配跨了所有時(shí)區(qū),一旦有問題在這里沒有解決,可能很快就傳到另外一個(gè)地方解決。我們這個(gè)產(chǎn)品實(shí)際上有垂直市場(chǎng)非常大的市場(chǎng)份額,而且接下來我會(huì)向大家介紹,我們?cè)谶@個(gè)市場(chǎng)上做的深度有多深,我們之所以現(xiàn)在在這個(gè)市場(chǎng)有80—85%的市場(chǎng)份額,要具體看地域,可能有略微的差異,主要是因?yàn)槲覀兡軌蚪o最終的客戶,通過我們的產(chǎn)品提供真正的一整套,適合他們的解決方法,我們?nèi)绾文軌蛑揽蛻粲惺裁磫栴},他們需要解決什么問題呢,我們就要和最終的用戶公司談,去了解他們的需求,這些客戶遍布航空行業(yè)、醫(yī)療行業(yè)、游戲等等,我待會(huì)兒再給大家介紹。
由于我們服務(wù)的客戶類型非常多樣,所以我們所提供的Quadro的產(chǎn)品平臺(tái)非常多樣化,這個(gè)和我們競(jìng)爭(zhēng)對(duì)手有一些不一樣,我們競(jìng)爭(zhēng)對(duì)手往往只有某一種類型,比如像桌面系統(tǒng)等等,我們實(shí)際上有筆記本電腦,用于臺(tái)式,用于工作站,還有單獨(dú)的Quadro Plex這個(gè)產(chǎn)品,圖形到了一定大的時(shí)候,往往需要的功耗是比較大的,把它放在一個(gè)里面可能不行,所以我們就出來了Quadro Plex的產(chǎn)品,用于這種需求,還可以用于刀片里面,惠普就用到我們一款Quadro產(chǎn)品,用在刀片里面,同時(shí)在不久之前我們還開始了有了服務(wù)器的環(huán)境,比如像遠(yuǎn)程的圖形等等。這些都是我們可以提供的不同的平臺(tái)的產(chǎn)品,具體的接下來會(huì)給大家介紹。
接下來這個(gè)問題是,為什么人們要選擇Quadro,為什么不能用GeForce呢?這個(gè)問題經(jīng)常人有提到,實(shí)際上GeForce用在對(duì)圖形要求并不算太高的應(yīng)用上,接下來我給大家舉一個(gè)例子,用AutoCAD這個(gè)軟件的例子,AutoCAD是大家比較常用的軟件,它的價(jià)錢并不是太高,大概4000美元左右,通過使用我們Quadro可以進(jìn)一步提升AutoCAD的性能。
AutoCAD2008版出來以后,已經(jīng)從2D轉(zhuǎn)向了3D,我們?cè)谒麄兂鰜碇?,也是?duì)我們Quadro Plex的進(jìn)行了相應(yīng)的調(diào)整,從而能夠更好的支持它運(yùn)用,而現(xiàn)在Autodesk、AutoCAD對(duì)硬件進(jìn)行認(rèn)證,以往他們并不這樣做,只所以要認(rèn)證,是因?yàn)?D的環(huán)境中發(fā)生風(fēng)險(xiǎn)更高,所以現(xiàn)在對(duì)硬件進(jìn)行認(rèn)證,當(dāng)然Quadro是經(jīng)過認(rèn)證的。相比較GeForce而言,Quadro有一個(gè)大的特點(diǎn)就是它的設(shè)計(jì),它的生產(chǎn)完全都是由我自己進(jìn)行的,而GeForce只是我們自己設(shè)計(jì)出來一個(gè)所謂的參考設(shè)計(jì),把這個(gè)交給我們的合作伙伴,由他們根據(jù)他們的最終產(chǎn)品的要求,進(jìn)行相應(yīng)的調(diào)整,比如說具體的規(guī)格,相應(yīng)的環(huán)境、風(fēng)扇、冷卻系統(tǒng)怎么做,都有他們自己不同的做法。他們對(duì)自己的最終產(chǎn)品負(fù)責(zé),而我們對(duì)他們進(jìn)行某些調(diào)整并不清楚。而在Quadro這個(gè)產(chǎn)品并不是這樣,完全由我們自己進(jìn)行管理,所以從性能價(jià)格比這個(gè)角度來說,可能差異并不大,但是從穩(wěn)定性,從受到認(rèn)證的情況來看,Quadro還是比GeForce要強(qiáng)很多。
大家看Autodesk的網(wǎng)站,大家可以看到它實(shí)際上對(duì)系統(tǒng)的要求增加了,原來都屬于標(biāo)準(zhǔn),現(xiàn)在隨著64位3D出來,實(shí)際上規(guī)格增加了,要求也增加了,而且開始做認(rèn)證了。如果說你去用這個(gè)軟件的話,實(shí)際上它里面時(shí)候會(huì)對(duì)這個(gè)系統(tǒng)的環(huán)境進(jìn)行檢測(cè),里面有一個(gè)叫性能調(diào)諧器,就會(huì)出來說這個(gè)環(huán)境是不是正常,上面的提示說的就是,現(xiàn)在的3D圖形環(huán)境是正常的。如果說你用的是一個(gè)未經(jīng)認(rèn)證的設(shè)備就會(huì)出來一個(gè)警告,會(huì)告訴你這個(gè)可以用,但是這個(gè)是未經(jīng)認(rèn)證的產(chǎn)品,這樣你可以用它,但是到底穩(wěn)定性和性能會(huì)是怎么樣,是不能保證的,而且出了問題是沒有辦法幫助你解決的。
大家如果看一下GeForce和Quadro價(jià)格在相同類似價(jià)位上,性能比較就可以看一下這張圖,這是一個(gè)雜志對(duì)AutoCAD的基本測(cè)試,左邊是GeForce,右邊的綠色點(diǎn)是Quadro,在不同的價(jià)格點(diǎn)上,Quadro的性能比GeForce高不少,也就是說很多人們會(huì)說Quadro太貴了,所以我們不用它,實(shí)際上用Quadro實(shí)際上不需要用那么高端的產(chǎn)品,可以往下降一降,在類似的價(jià)格上可以獲得更好的性能,并且是更穩(wěn)定的效果。這張總計(jì)了一下我剛才講的東西。
現(xiàn)在我們來看一下架構(gòu),架構(gòu)這塊兒大約在8個(gè)月之前,我們做出了一個(gè)改變,就是隨著G80這個(gè)產(chǎn)品的推出,我們公司在也是最先推出所謂統(tǒng)一架構(gòu)的,我不知道大家誰知道統(tǒng)一架構(gòu)這個(gè)概念?對(duì)于統(tǒng)一架構(gòu)來說,現(xiàn)在如果你要用OpenGL,DirectX10,并且用Shader Model4.0,就必須要有統(tǒng)一架構(gòu),否則就沒有辦法進(jìn)行運(yùn)行。為什么?我們先看一下過去20年當(dāng)中,到底是一個(gè)什么樣的情況?首先我們知道這是GPU的工作流程,首先是負(fù)責(zé)幾何這塊兒,有負(fù)責(zé)像素這塊兒,在幾何這塊兒,應(yīng)該由8個(gè)管線,在像素這塊兒有24個(gè)管線,幾何這塊兒處理三角形、點(diǎn)、多邊形等等,像素這塊兒主要是進(jìn)行紋理、渲染、光線等等這些東西,這些會(huì)進(jìn)行混合,要進(jìn)行抗鋸齒的處理等等。這些數(shù)據(jù)再放到幀緩存當(dāng)中,再顯示到屏幕上,這在過去20年當(dāng)中,圖形處理的程序。大家好象聽上去有點(diǎn)兒暈的感覺,但是大家不用擔(dān)心,大家不用去設(shè)計(jì)GPU。
老的管線架構(gòu)有什么不好呢?老的架構(gòu)處理幾何這塊兒的管線和處理紋理這塊兒的管線是分開的,就是它只能做這個(gè),或者只能做那個(gè),我們看第一張圖的形狀,它負(fù)責(zé)幾何的管線處理幾何就非常繁忙,處理像素的下面沒有幾何形狀,但是有光線效果,還有紋理,差異非常大,所以在處理這張圖,就使得上面的負(fù)責(zé)幾何的這方面的管線沒有什么事情干,而負(fù)責(zé)像素的處理,紋理的管線就會(huì)非常繁忙。
再看一下這張圖,我們之前看到的是非統(tǒng)一的架構(gòu),也就是管線要么只能做這個(gè),要么只能做那個(gè),這上面是一個(gè)統(tǒng)一的架構(gòu),這個(gè)圖看上去非常復(fù)雜,但是基本上面每一個(gè)綠點(diǎn)都代表一個(gè)管線,最大的是128個(gè),既可以進(jìn)行像素的處理也可以進(jìn)行幾何的處理,不像以前只能做這個(gè)或者那個(gè),以前是8個(gè)幾何的管線,加上24個(gè)像素的管線是32個(gè),現(xiàn)在我們?cè)谶@上面最大的可以有128個(gè)管線。(大家隨時(shí)都可以提出問題來)
在統(tǒng)一架構(gòu)之下,跟以前就不一樣了,以后在統(tǒng)一架構(gòu)之下,如果是非常多的幾何的圖,所有線程處理器都可以進(jìn)行幾何的處理,不像以前有一些只能用來進(jìn)行像素的處理。下面這張圖是在紋理光線這塊兒,所以所有的線程處理器都可以進(jìn)行相應(yīng)的對(duì)光線和紋理的處理,其他的幾何處理只是其中很少的一部分。
在Quadro下面,我們也是針對(duì)不同的市場(chǎng)細(xì)分,在Quadro NVS這塊兒,主要針對(duì)2D的市場(chǎng),還有金融業(yè)、呼叫中心等等,這個(gè)是用的比較多的在Quadro FX往往用于數(shù)字應(yīng)用,創(chuàng)新用的比較多,另外一塊兒是比較專門行業(yè)的應(yīng)用,比如說SDI,在廣播行業(yè)的應(yīng)用,還有應(yīng)用到大的屏幕強(qiáng)上面的,就需要用到我們同步幀鎖定交換鎖定的技術(shù),像你們看到在右下角這個(gè)Quadro G-Sync,在非常高的性能下放可以使用Quadro Plex這樣的產(chǎn)品。 針對(duì)于每一種應(yīng)用,我們都有相應(yīng)的應(yīng)用軟件包,同時(shí)我們會(huì)把這些硬件和軟件提供給相應(yīng)的公司,讓他們進(jìn)行認(rèn)證,進(jìn)行測(cè)試,這就是為什么我們?cè)赒uadro這塊兒有非常多的合作伙伴。
這上面是我們幀鎖定和交換鎖定的技術(shù),如果大家聽了上午的演講,可能已經(jīng)聽到過相關(guān)的東西這是用在非常大的投影的顯示屏幕上,同時(shí)也用在3D的模擬空間當(dāng)中,比如說用在產(chǎn)品的模擬還有一些產(chǎn)品的評(píng)估等等,比如在在投影屏幕應(yīng)用當(dāng)中,可以用相對(duì)簡單的做法,像有一個(gè)系統(tǒng)兩個(gè)投影機(jī)投到一個(gè)屏幕上面,現(xiàn)在很多用戶要求有更高的性能,所以會(huì)把這個(gè)分成4—6個(gè)接點(diǎn),就需要主機(jī)和附屬機(jī)當(dāng)中實(shí)現(xiàn)比較好的同步,否則的話,整個(gè)的圖象就會(huì)亂套了,這就是為什么我們有幀鎖定和交換鎖定來保證主機(jī)和其他附屬的機(jī)器之前能夠?qū)崿F(xiàn)好的同步。
#p#page_title#e#
第5頁:NVIDIA媒體圓桌會(huì)——Walter演講(下)
舉個(gè)例子,這是空客車,在歐洲他們所做的大的3D的模擬空間,這里用到了32個(gè)投影機(jī),有16個(gè)屏幕,每個(gè)屏幕都是立體的,也就是一個(gè)投影機(jī)是管你的左眼,一個(gè)是管右眼,在前后左右上下都有相應(yīng)的屏幕,它的大小和實(shí)際的大小是1:1比例,使得人在這里面可以用3D的模擬方式看到實(shí)際是一個(gè)什么樣的情形。在SGI公司不在市場(chǎng)上之后,我們公司是唯一一個(gè)能夠提供這種解決方案的公司了。
還有就是我們Quadro Plex這個(gè)產(chǎn)品。這里有一個(gè)例子,是比較新的索尼4K的投影機(jī),一個(gè)投影機(jī)有4個(gè)輸入,在他們參考的配置當(dāng)中用的就是Quadro這個(gè)產(chǎn)品,因?yàn)樗鬅o縫,并且是一個(gè)工作站的解決方案,他們認(rèn)為用Quadro產(chǎn)品是最為適合的。我們還有遠(yuǎn)程的圖形的產(chǎn)品,比如像在服務(wù)器環(huán)節(jié)當(dāng)中的,在這個(gè)當(dāng)中包含有4個(gè)高端的GPU,每個(gè)有1.5GB的緩存,在這個(gè)當(dāng)中大家可以看到把風(fēng)扇都放在下端了,它們屬于非常吵的,在使用這樣一個(gè)產(chǎn)品的環(huán)境下,大家都不愿意放在身邊,它專門是用服務(wù)器的環(huán)節(jié)設(shè)置的。對(duì)很多公司來說,他們希望能夠在服務(wù)器的房間當(dāng)中把圖形的功能可以完成,出于安全考慮,可以在服務(wù)器當(dāng)中把這些事情做完,再通過傳輸,傳輸?shù)浆F(xiàn)實(shí)設(shè)備去,這是他們認(rèn)為以后希望實(shí)現(xiàn)的,而我們現(xiàn)在正在開始往這個(gè)方向努力。還有一個(gè)服務(wù)器的應(yīng)用就是在金融類領(lǐng)域,他們不是出于安全的考慮,而是出于空間的考慮,比如說一個(gè)交易員,前面要擺6臺(tái)、8臺(tái)、10幾臺(tái)的顯示屏幕,他不希望放更多的電腦,而是希望使用服務(wù)器的解決方案,這也是介紹在空間當(dāng)中產(chǎn)生一些熱或者其他相關(guān)的污染。我們QuadroNVS這個(gè)產(chǎn)品,很多是為金融行業(yè)設(shè)計(jì)的,它們集中在工作站之內(nèi),有相應(yīng)的軟件幫助他們進(jìn)行多個(gè)顯示器的管理等等,還有很多金融企業(yè)所需要的功能都可以通過我們的軟件來進(jìn)行實(shí)行。
大家看到的這些產(chǎn)品都是使用統(tǒng)一架構(gòu),而我們最新推出就是FX3700,還有512兆的幀緩存,它的性能也會(huì)非常高,這個(gè)產(chǎn)品比較前面的產(chǎn)品它的性能提高是什么樣的情況呢?這張圖是我們新一代產(chǎn)品和此前產(chǎn)品之間的性能比較,藍(lán)色柱是我們新一代產(chǎn)品,黃色是前一代的產(chǎn)品,370是新一代,350是之前那一代,570是新一代,560是之前一代,這樣依此類推,可以看到在不同的高低端的產(chǎn)品上,新一代的產(chǎn)品性能相比較前一代都有比較大的提升,而且新一代低端一些的產(chǎn)品甚至超過了前一代比它高一級(jí)的產(chǎn)品。大家可以看到,我們最新推出的中高端的產(chǎn)品,F(xiàn)X3700,它和FX4600性能已經(jīng)沒有什么太多的差別了,至少從這個(gè)評(píng)測(cè)上面來說是這樣,它們之間的價(jià)格還有一定的差距,但是在這里所做的測(cè)試并沒有太多的考慮到,比如像幀緩存所帶來的影響,比如說你要處理很多紋理,有大量的數(shù)據(jù)的情況下,實(shí)際上幀緩存的大小對(duì)你的結(jié)構(gòu)還有比較大的影響,因?yàn)?700、4600、5600它們各自的幀緩存都不一樣,(一個(gè)是5、6兆,一個(gè)是8.5兆),看它們最終運(yùn)行什么的軟件,可能最終出來的結(jié)果還是有一定的差異。除此以外,在我們一個(gè)產(chǎn)品推出在市場(chǎng)存在的生命周期當(dāng)中,我們往往會(huì)進(jìn)行4—6次驅(qū)動(dòng)的改進(jìn),而且我們這個(gè)驅(qū)動(dòng)是所謂統(tǒng)一的驅(qū)動(dòng),我們所出來新的驅(qū)動(dòng)可以用在以前的產(chǎn)品上面,所以往往我們每過兩到三個(gè)月普遍就會(huì)對(duì)驅(qū)動(dòng)進(jìn)行一些更新,一般來說根據(jù)我們的歷史經(jīng)驗(yàn),在一個(gè)產(chǎn)品從推出到撤出市場(chǎng)這段時(shí)間之內(nèi),它的性能由于驅(qū)動(dòng)的改進(jìn)會(huì)有30—50%的提高,所以大家從這張圖上所看到的性能的表現(xiàn)還不是最后能夠達(dá)到的最高的狀況。
同時(shí),我們新推出的產(chǎn)品,它在功耗上面也有所降低,像3700這款,功耗大概在78瓦左右,而之前這一代是在150瓦左右,性能優(yōu)60%的提高,功耗大概下降了一半左右,總的來說我們這些新的產(chǎn)品每瓦效能都有比較大的提升,在上面所列出的產(chǎn)品當(dāng)中,都已經(jīng)經(jīng)過了能源之星的評(píng)定。我們這些產(chǎn)品從FX370—FX3700都用PCI-E2.0,意味著我們總線帶寬已經(jīng)提高了。當(dāng)然坦白來說,大部分的應(yīng)用并不能用到這些帶寬,只能在很高端的應(yīng)用上使用這些帶寬。
與此同時(shí),我們還在驅(qū)動(dòng)環(huán)境當(dāng)中不斷提高我們的產(chǎn)品用戶友好性,比如我們有一個(gè)叫ACE(程序配置引擎),為什么要有這個(gè)呢?我們知道對(duì)專業(yè)用戶來說,他們往往同時(shí)使用多個(gè)軟件,比如在桌面上同時(shí)運(yùn)行幾個(gè),AutoCAD、Autodesk等等,同時(shí)打開,往往在以前他們需要針對(duì)于每一個(gè),比如說利用這個(gè)應(yīng)用的時(shí)候,需要對(duì)于驅(qū)動(dòng)進(jìn)行相應(yīng)的設(shè)置,以實(shí)現(xiàn)最優(yōu)的性能,再用另外一個(gè)再重新設(shè)置一遍,這樣很麻煩?,F(xiàn)在我們有了這個(gè)ACE,就會(huì)自動(dòng)發(fā)現(xiàn)他在用什么,比如說你點(diǎn)開了新的軟件,新的程序,它就會(huì)發(fā)現(xiàn)你已經(jīng)用這個(gè)東西了,它就會(huì)進(jìn)行相應(yīng)的驅(qū)動(dòng)配置的調(diào)整,使得你可以在用這個(gè)程序的時(shí)候?qū)崿F(xiàn)最優(yōu)的性能,這個(gè)是我們最近才剛剛推出的,現(xiàn)在是用在Vista和XP上面。這是我們剛剛所推出的比較新的產(chǎn)品,是一周之前才推出的,我就不具體講產(chǎn)品具體的規(guī)格,如果大家有興趣可以聯(lián)系我們?cè)谥袊耐?,因?yàn)橐灿型略谶@邊,可以想他們要一些樣品等等,可以進(jìn)行一些檢測(cè)等等。
現(xiàn)在我們看一下,在垂直市場(chǎng)上面所做的工作,對(duì)于競(jìng)爭(zhēng)對(duì)手來說,他們對(duì)于垂直市場(chǎng)的定義,比如說制造業(yè),實(shí)際上對(duì)我們來說,制造業(yè)并不是一個(gè)真正的簡單的垂直市場(chǎng),比如像在制造業(yè)當(dāng)中就可以分成汽車、航空、造船等等。而在僅僅在汽車這個(gè)行業(yè),都可以分成非常多的步驟,而且是非常復(fù)雜的。比如說首先是造型,在造型這塊兒就要畫出車的圖等等,你想讓它是什么樣的形狀,通過造型就進(jìn)入到設(shè)計(jì)階段,比如說你車身和表面怎么做,儀表盤,相應(yīng)的電子設(shè)備,還有動(dòng)力總成,包括你的引擎、發(fā)動(dòng)機(jī)、輪子應(yīng)該怎么樣,還有軸等等到底怎么樣設(shè)計(jì)。在設(shè)計(jì)之后還要進(jìn)行數(shù)字的模擬,就是上面的DMU,就是數(shù)字的模擬,還要考慮到駕駛的模擬,還有碰撞模擬,還有空氣動(dòng)力學(xué)方面的考慮。同時(shí),在這個(gè)之后還需要進(jìn)入生產(chǎn)過程,就要進(jìn)行模具的制造,這個(gè)過程當(dāng)中也會(huì)用到可視化的東西,同時(shí)在工廠的設(shè)計(jì)上也希望是最為合理的,所以也需要首先要有一個(gè)數(shù)字工廠,進(jìn)行數(shù)字模擬,需要最大的合理性,這些過程當(dāng)中會(huì)生成很多3D數(shù)據(jù),也可以應(yīng)用到市場(chǎng)營銷當(dāng)中。
舉個(gè)例子來說,像奧迪2.8這個(gè)車,在相應(yīng)的資料片上市之前,實(shí)際上并沒有一輛真實(shí)的車存在,所有的資料片當(dāng)中所用的東西都是利用3D制作出來的。這些3D數(shù)據(jù)化可以用做很多的用途,像保時(shí)捷有了這些3D數(shù)據(jù)之后,應(yīng)用到他們的培訓(xùn)當(dāng)中,比如說修理的培訓(xùn),還有在網(wǎng)絡(luò)上讓這些用戶可以自己來進(jìn)行車輛的配置,通過使用3D數(shù)據(jù),我們不久之前也收購了一個(gè)公司,這個(gè)公司也做很多相關(guān)的產(chǎn)品的開發(fā),比如說在網(wǎng)絡(luò)上如何進(jìn)行實(shí)時(shí)的車載的配置等等,這都是他們的專長,同時(shí)也可以把這種技術(shù)用到經(jīng)銷商的終端,比如像通用汽車歐寶這個(gè)品牌,他們?cè)跉W洲已經(jīng)是部署了600臺(tái)這樣的終端,而且通過使用這樣的終端,每一個(gè)經(jīng)銷商都可以把他們的銷售增加30%。
現(xiàn)在我們可以看到,在整個(gè)汽車的設(shè)計(jì)、生產(chǎn)、銷售過程當(dāng)中,在很多的步驟上都可以用到我們這個(gè)產(chǎn)品,比如說像前面在演講當(dāng)中大家也看到了,在車身內(nèi)部現(xiàn)在一些GPU產(chǎn)品的使用,比如在顯示屏儀表盤,有駕駛員的支持系統(tǒng)等等,這些都可以用這個(gè)技術(shù),而且現(xiàn)在很多的領(lǐng)域有CUDA和Tesla的產(chǎn)品,在模具方面我們希望使用通用的GPU,像模具制作過程當(dāng)中,會(huì)有一些塑料跟一些金屬,它們之間要脫開需要有一個(gè)比較巧妙的角度,一個(gè)什么樣的角度可以做的最好,這些都可以通過GPU的使用進(jìn)行相應(yīng)的模擬,從而實(shí)現(xiàn)最佳的模具制作,在這方面我們都在進(jìn)行工作。
大家可以看到這些是我們?cè)谥袊獾暮献骰锇楹涂蛻?,里面有美國、歐洲、日本、韓國,Google也是我們的客戶,比如像Google Earth,我們跟大眾進(jìn)行一個(gè)導(dǎo)航系統(tǒng)的研發(fā),就會(huì)把數(shù)據(jù)從Google Earth拿過來,車?yán)锏鸟{駛員就可以讀到這些數(shù)據(jù)。Google也用到我們的服務(wù)器相應(yīng)環(huán)境的產(chǎn)品,比如在服務(wù)器當(dāng)用到了媒體通信處理器,在美國的Google在他們的平臺(tái)之上就有100萬個(gè)服務(wù)器接點(diǎn)。當(dāng)然,也可以看到我們的客戶遍布非常多的行業(yè),比如在汽車行業(yè),大家看到了很多汽車公司,還有醫(yī)療設(shè)備,包括通用電器,還有飛利浦、西門子等等,還有廣播電視臺(tái)等等,還有像電子產(chǎn)品,很多這些公司大家都非常熟悉,都是我們的客戶。在中國我們時(shí)間非常短,在Quadro這塊兒僅僅只有一年半的時(shí)間,但是我們也非常高興,中國的公司也非常愿意使用我們的產(chǎn)品。從這一頁上可以看到使用我們相關(guān)產(chǎn)品的公司的名字,寶鋼、福田汽車、通用、大眾、一汽等等,當(dāng)然也有原因是因?yàn)樗麄兒芏喽己蛧獾能噺S進(jìn)行合資,像豐田、大眾、奧迪等等,所以我們進(jìn)入的途徑相對(duì)來說也比較容易。
這上面大家可以看到更多,比如說數(shù)字內(nèi)容制作,還有游戲行業(yè),我們?cè)趪鴥?nèi)的一些客戶,我也認(rèn)識(shí)客戶當(dāng)中很多的人,我們的銷售團(tuán)隊(duì)在中國也有很多的相關(guān)人員,我們也會(huì)到世界各地去和這些客戶談,去了解他們存在什么樣的問題,我們看是不是可以通過我們軟件的合作伙伴幫助他們解決相應(yīng)的問題,當(dāng)然通過利用我們的產(chǎn)品。
我已經(jīng)講了很長時(shí)間,聽了這么多,大家都覺得自己可以去設(shè)計(jì)圖形卡了,不知道大家現(xiàn)在有沒有什么問題?非常愿意回答大家的問題。
記者:剛才說到Quadro是通過動(dòng)態(tài)分配統(tǒng)一渲染,兩個(gè)單元,渲染單元和像素單元,我想知道是怎樣進(jìn)行的,是通過CUDA嗎?協(xié)調(diào)動(dòng)態(tài)統(tǒng)一是如何進(jìn)行的?
Walter:主要通過GPU當(dāng)中的驅(qū)動(dòng)來進(jìn)行的,到底哪些是幾何,哪些是像素部分,比如說這個(gè)數(shù)據(jù)進(jìn)來,我們這個(gè)軟件就會(huì)自動(dòng)判斷,到底是屬于處理三角形、幾何這塊兒,還是處理像素紋理這塊兒,對(duì)每一幀進(jìn)行測(cè)試,看哪些屬于幾何,哪些屬于像素這塊兒,總的來說由驅(qū)動(dòng)進(jìn)行分配,這和CUDA不一樣,CUDA是針對(duì)于每一個(gè)處理器,在CUDA當(dāng)中是通過驅(qū)動(dòng)來進(jìn)行的。
記者:有沒有與奧運(yùn)會(huì)相關(guān)的客戶以及新的應(yīng)用?
Walter:我們確實(shí)有,但是沒有得到客戶的許可,沒有辦法給予一些詳細(xì)的信息,比如我們跟(索貝)有很多的合作關(guān)系,他們是給很多廣播類的公司進(jìn)行軟件服務(wù),特別是高清環(huán)境下,高清電視和3D內(nèi)容是做的比較多的領(lǐng)域,還有(水晶石)這個(gè)公司,也在這方面做很多的工作,也是我們的合作伙伴。
記者:是不是針對(duì)細(xì)分的垂直市場(chǎng)的功能,是不是已經(jīng)集成在里面了?
Walter:我覺得你說的沒錯(cuò),比如說我們針對(duì)于廣播行業(yè),我們有SDI的技術(shù),SDI應(yīng)該叫串行數(shù)字接口,它可以幫助實(shí)現(xiàn)你的3D內(nèi)容和視頻融合在一起,如果做到這一點(diǎn),就需要有一個(gè)SDI的輸入,往往以前的做法先在 GPU上面做,然后再到SDI板上面去,現(xiàn)在通過我們這個(gè)產(chǎn)品,就把GPU和SDI放在一起,可以實(shí)現(xiàn)實(shí)時(shí)動(dòng)畫等等,我們針對(duì)超大的屏幕墻有我們的同步鎖幀的技術(shù),針對(duì)數(shù)字內(nèi)容創(chuàng)建OpenGL,我們有專門的驅(qū)動(dòng),我們針對(duì)不同的市場(chǎng)有不同的驅(qū)動(dòng),還有相應(yīng)的硬件??匆幌挛覀冞@個(gè)產(chǎn)品系列,我們有8個(gè)標(biāo)準(zhǔn)產(chǎn)品,有5、6個(gè)針對(duì)不同行業(yè)的行業(yè)性的產(chǎn)品。大家可以看到下面這張畫是針對(duì)不同的,比如像SLI可以實(shí)現(xiàn)更高的性能,SDI是適用于廣播的行業(yè),最后一個(gè)主要是在服務(wù)器環(huán)節(jié)當(dāng)中進(jìn)行使用的。還有一個(gè)MBS,這個(gè)產(chǎn)品主要是針對(duì)金融行業(yè)的還有呼叫中心,甚至包括9.11這種急救電話中心,因?yàn)樗麄冇泻芏嗥聊恍枰瑫r(shí)進(jìn)行管理。
記者:是不是這些是我們目前有的垂直專業(yè)市場(chǎng)的產(chǎn)品?
Walter:這是目前我們有的垂直專業(yè)市場(chǎng)的產(chǎn)品都在上面。這里面實(shí)際上有些是第三代產(chǎn)品,G-SyncII已經(jīng)是第三代產(chǎn)品,SDI是第二代產(chǎn)品,Plex是第二代產(chǎn)品,服務(wù)器是第一代產(chǎn)品。
記者:剛才說這個(gè)這個(gè)圖形服務(wù)器跟Tesla在應(yīng)用上有什么差異嗎?
Walter:這里有一些不同,首先Quadro Plex是支持OpenGL,而Tesla是不支持OpenGL的這是一個(gè)區(qū)別。第二,他們的內(nèi)存不一樣,因?yàn)閷?duì)于計(jì)算來說內(nèi)存非常重要,所以Tesla是一種特別的內(nèi)存,比如說對(duì)圖形來說,即便內(nèi)存犯一點(diǎn)兒錯(cuò)也不是那么大的問題,因?yàn)橐粋€(gè)像素每秒鐘要變50次,有一點(diǎn)兒錯(cuò)誤沒太大的問題,Tesla是用于計(jì)算,如果這里有錯(cuò)誤,都會(huì)影響后面的計(jì)算,所以后面的準(zhǔn)確性都非常重要。我們?cè)赥esla當(dāng)中有一個(gè)內(nèi)存控制器它會(huì)對(duì)對(duì)錯(cuò)進(jìn)行檢查,這和Quadro是不一樣的,而且本身它的內(nèi)存也是特殊的內(nèi)存也不一樣??偟膩碚f,Quadro支持OpenGL,Tesla內(nèi)存更好一些,GeForce就便宜一點(diǎn)。Quadro其是從圖形的角度,Tesla是計(jì)算的角度。
#p#page_title#e#
第6頁:NVIDIA專業(yè)圖形解決方案高端論壇——Andy篇(上)
時(shí) 間:2008年1月17日
地 點(diǎn):北京麗思卡爾頓酒店酒店 大宴會(huì)廳
Andy Keane:非常感謝大家今天來參加我們的論壇,這是我第一次到中國到北京,我覺得這個(gè)機(jī)會(huì)非常棒。今天我要跟大家介紹什么呢?是一種為大家設(shè)計(jì)推出的全新技術(shù),幫大家解決軟件開發(fā)中的新問題。
CUDA技術(shù)是在去年推出,在Tesla之后推出,主要作用是幫助大家解決在你們的軟件、科學(xué)研究和工程當(dāng)中出現(xiàn)的新問題,所以我的演講會(huì)是兩部分,首先是CUDA技術(shù),CUDA技術(shù)怎么出現(xiàn)的,大家如何使用這個(gè)技術(shù),然后講另外一個(gè)產(chǎn)品線就是Tesla,這個(gè)產(chǎn)品線是面向工業(yè)應(yīng)用的,把GPU用于以前沒有用過的地方,比如說數(shù)據(jù)中心,人們?cè)谶M(jìn)行科學(xué)研究以及工程方面的應(yīng)用。
從這張圖上大家可以看到,可編程GPU隨時(shí)間發(fā)展的狀況,2002年我們推出了第一個(gè)可編程的GPU,在那個(gè)時(shí)候我們的變成單元只涉及了GPU的很小一塊兒——著色器,于是,在2002年,我們開始有了可編程的著色器。因?yàn)槲覀兊挠脩羰窍M羞@樣一種功能的推出,這樣的話就使得那些開發(fā)人員他們可以在圖形當(dāng)中做一些特殊的效果,就可以用到他們的創(chuàng)造性。因?yàn)楸緛鞧PU的功能是特定,而在2002年我們也希望能夠把GPU用于除了圖形以外的一些應(yīng)用,在2002年我們就推出了32位的浮點(diǎn),這不僅僅是用于圖形的,把這個(gè)技術(shù)給了開發(fā)人員,而最終我們犯了一個(gè)錯(cuò)誤,就是在早期我們忘了一個(gè)重要的事情,這個(gè)重要的事情就是這是一個(gè)軟件工具,我們必須要能夠解決軟件開發(fā)人員的問題,不僅僅給他們一個(gè)硬件,一個(gè)新的處理器是不夠的,因?yàn)樵谀莻€(gè)時(shí)候GPU僅支持OpenGL圖形計(jì)算的,我們認(rèn)識(shí)到這個(gè)錯(cuò)誤重新開始,在2003年我們用了一些新的人,像計(jì)算機(jī)架構(gòu)人員,語言開發(fā)人員,讓他們和圖形以及工程人員一起開始了新的項(xiàng)目,最終就推出了我們的CUDA的技術(shù)。CUDA技術(shù)不僅僅是GPU的計(jì)算技術(shù),同時(shí)也是編程環(huán)境,編程語言,它是第一個(gè)能夠把定型計(jì)算串行計(jì)算融入到一起的技術(shù)。開發(fā)人員解決了一個(gè)計(jì)算問題,他們用的C語言,C++,登記于網(wǎng)絡(luò)的語言或者是Java。他們?cè)诰幱?jì)算程序的時(shí)候,他們?cè)趺磥碜龅哪兀克麄兪亲鲆粋€(gè)C程序,然后就在CPU上進(jìn)行串行的計(jì)算,這個(gè)計(jì)算是按順序來進(jìn)行的。給大家看一個(gè)例子,要進(jìn)行并行計(jì)算的話,開發(fā)人員不得不加很多的軟件,就像多核或者是集群,你必須要用軟件的工具來解決并行計(jì)算問題,我們?cè)贑UDA當(dāng)中怎么做的呢?
在CUDA當(dāng)中,我們創(chuàng)建了一個(gè)環(huán)境,CUDA是可以統(tǒng)一并行和串行計(jì)算,CUDA是有三個(gè)組成部分,他是一個(gè)C語言編譯器,實(shí)際上用CPU的編譯工具開發(fā)出來的,這個(gè)方式IBM經(jīng)常使用,還有一個(gè)專門的計(jì)算驅(qū)動(dòng)程序,這不是一個(gè)圖形的驅(qū)動(dòng),而往往速度更快,而且和圖形的驅(qū)動(dòng)不一樣,這樣的話就可以增加我們的計(jì)算能力,并且獨(dú)立圖形之外的,還有工具,還有標(biāo)準(zhǔn)的CPU類型的工具,包括像調(diào)試程序,分析器,我們還有很多樣本例子來說明如何用技術(shù)來解決一些相關(guān)的問題。我們還有很多的培訓(xùn),還有手冊(cè),還有教育工具,能夠讓開發(fā)人員來學(xué)習(xí)如何在GPU上進(jìn)行編程。我們看一下首先是計(jì)算的格式,我原來是做微處理器設(shè)計(jì)的,我們使用單核做一個(gè)設(shè)計(jì),有一個(gè)指令在任何時(shí)間都能進(jìn)行一個(gè)指令的執(zhí)行。它是一種串行的方式,也就是一個(gè)一個(gè)指令來的。如果CPU是按照順序來的,而且是一小塊兒、一小塊兒來的,而CPU的工作方式首先要有很高的頻率,而且要很大的緩存,這樣的話就可以實(shí)現(xiàn)非常高速的串行計(jì)算。但是看一下GPU非常不一樣,GPU的設(shè)計(jì)可以解決并行的計(jì)算問題,圖形就是這樣,向每一幀大量的像素,像3D當(dāng)中更是以百萬進(jìn)行計(jì)算,這些都是并行實(shí)時(shí)的,所以大量的同時(shí)通過GPU,而且大量是并行,同時(shí)進(jìn)行計(jì)算。就是說把所有的數(shù)據(jù)一起拿進(jìn)來,可能是128個(gè)處理器同時(shí)進(jìn)行計(jì)算,所有都是同時(shí)進(jìn)行。CUDA就是這兩種類型之間的連接點(diǎn),開發(fā)人員開發(fā)一個(gè)C程序,然后把CPU的代碼和GPU的代碼在原代碼當(dāng)中共存,而CUDA成為了串行計(jì)算和并行計(jì)算的連接,心里我們有一個(gè)編譯器在GPU上可以并行使用,CUDA可以延伸到CPU當(dāng)中,也就是說大家可以編CUDA的程序,并且可以在CPU上面進(jìn)行執(zhí)行,所以可以用并行的概念,并行是用于不同的設(shè)計(jì)當(dāng)中。
看一下到底在一個(gè)并行和串行當(dāng)中有哪些不同的特性呢?首先看一下GPU,它不是代替CPU,它們必須是攜手合作,因?yàn)镃PU有很多的技術(shù),可以解決某些特定的問題,這些問題是非次序的,這些數(shù)據(jù)必須按照數(shù)據(jù)進(jìn)行。操作系統(tǒng)就是一個(gè)非常經(jīng)典的類型問題,是CPU非常善于處理的,很多不同的功能之間沒有關(guān)聯(lián)性,所有的數(shù)據(jù)之間沒有關(guān)聯(lián)性,所以要實(shí)現(xiàn)這種功能。還有數(shù)據(jù)庫,同時(shí)還有時(shí)間的壓縮,同時(shí)不斷地使用同樣的代碼,這種類型對(duì)CPU來說非常適用。GPU就不一樣了,有一些類型的問題,他們存在共同性,存在共同的主題。首先是海量數(shù)據(jù)的處理,像石油天然氣,他們從大陸上海上搜集到大量的數(shù)據(jù),然后需要進(jìn)行處理怎么樣來進(jìn)行挖井,還有金融風(fēng)險(xiǎn),股票市場(chǎng),國內(nèi)還有其他國家的,所有這些信息數(shù)量非常大,需要進(jìn)行處理幫助人們進(jìn)行正確的決策。
還有另外一個(gè)例子就是醫(yī)療成像,在先進(jìn)的醫(yī)療設(shè)備當(dāng)中,比如像CT機(jī)或者是核磁共振,往往傳感器會(huì)出來大量的數(shù)據(jù)需要同時(shí)進(jìn)行處理,這對(duì)GPU來說非常適用。當(dāng)然GPU是需要和CPU來進(jìn)行合作,進(jìn)行數(shù)據(jù)的管理,對(duì)操作系統(tǒng)進(jìn)行管理等等。GPU上有三個(gè)不同的東西,首先有專用的計(jì)算,在GPU當(dāng)中,在進(jìn)行計(jì)算的時(shí)候是一種非常特殊的方式進(jìn)行,它不再做圖形,而是將自己作為一個(gè)計(jì)算單元模擬一個(gè)處理器就是來進(jìn)行計(jì)算。第二,GPU上的C環(huán)境,C是什么,任何開發(fā)人員理解C語言,現(xiàn)在就可以理解如何來對(duì)GPU進(jìn)行編程,而真正的挑戰(zhàn)很多開發(fā)人員面臨的就是如何來進(jìn)行一個(gè)并行的計(jì)算機(jī)的軟件,這個(gè)和其他的是一樣的,無論是多核還是集群,或者是GPU問題是一樣的,并不是一個(gè)單獨(dú)的GPU的問題。第三,出去在數(shù)據(jù)中心有一個(gè)問題,比如說你有一個(gè)高性能的工作站進(jìn)行工程設(shè)計(jì)等等,我們有一個(gè)專門的GPU產(chǎn)品針對(duì)這種環(huán)境。其中金融方面的計(jì)算,這是非常復(fù)雜的,結(jié)果非常不錯(cuò)。還有另外一個(gè)是天體物理學(xué),就在今年波士頓就有一個(gè)專門的會(huì)議就是有關(guān)GPU在天體物理學(xué)當(dāng)中的使用,有一百多個(gè)科學(xué)家會(huì)來講,他們來自全世界,會(huì)講到新的類型的研究在GPU上面,以及他們?nèi)绾伟堰@個(gè)利用到天體物理學(xué)的研究當(dāng)中。在這樣的一些應(yīng)用當(dāng)中,還有一些設(shè)計(jì)應(yīng)用當(dāng)中,他們以前需要在大的計(jì)算機(jī)集群上,比如現(xiàn)在可以在工作站就可以解決了。
而且非常強(qiáng)調(diào)游戲的體驗(yàn),游戲的性能,CUDA前面Walter也講到了,是用一些專業(yè)的應(yīng)用,某些特定的產(chǎn)品,一些性能。
第三個(gè)就是Tesla,為什么要用Tesla,是因?yàn)樵跀?shù)據(jù)中心沒有GPU,所以我們是專門引出了這種產(chǎn)品,針對(duì)特定類型的客戶。在這些GPU上,他們能做一些什么呢?大家可以看一下在GeForce上面,為什么要用GeForce上面的CUDA呢?除了游戲以外,很多游戲人員把CUDA納入游戲當(dāng)中,還有很多圖像,有很多數(shù)據(jù)是相機(jī),我們可以獲得更快的圖像,更大的像素,更好的互動(dòng),更平滑的畫面。用CUDA可以把所有這些好的這種圖像功能用出來,還有音頻、編碼、解碼、壓縮、安全性等等,所有這些功能都可以在GPU上并行處理。CUDA可以實(shí)現(xiàn)圖像可視化和音頻圖像同步。
通過CUDA可以讓這些更快,還有我們前面講了Tesla,它有哪些應(yīng)用,下面我會(huì)更具體的講。這是最新的應(yīng)用,在過去兩三個(gè)月當(dāng)中出現(xiàn)的,像實(shí)時(shí)的期權(quán),還有分子動(dòng)力學(xué),還有超聲影像,這是分子動(dòng)力學(xué)當(dāng)中的代碼,可以是嵌入到很多其他的不同的環(huán)境當(dāng)中,我們有很多的例子,在地震偏移等等。CUDA可以免費(fèi)提供,所以有很多的軟件不斷地出來我們也非常關(guān)注這些發(fā)展。
#p#page_title#e#
第7頁:NVIDIA專業(yè)圖形解決方案高端論壇——Andy篇(下)
現(xiàn)在看一下Acceleware的例子,這是開始一些公司在用圖形的API進(jìn)行計(jì)算,2006年他們推出一個(gè)產(chǎn)品是手機(jī)模擬的產(chǎn)品,很多手機(jī)上的天線用GPU進(jìn)行模擬,為了保證信號(hào)的完整性不受損害,還有安全,很多的廠商在設(shè)計(jì)手機(jī)的時(shí)候,會(huì)使用到GPU,這個(gè)技術(shù)也是嵌入的,而且也非??欤a(chǎn)品推出的時(shí)候,我們是展示了一種差異,如果用僅僅用CPU,或者相比較CPU和GPU的差異,如果僅僅用CPU的話,CPU需要15小時(shí),而GPU只需要15分鐘。我們跟媒體見面的時(shí)候,把這個(gè)給他們看了,基本說就在我講完之后,可能一個(gè)模型就已經(jīng)完成了,如果你用比較慢的技術(shù),可能要等到明天。對(duì)工程師來說這個(gè)完全不一樣,因?yàn)橥ㄟ^快的技術(shù),他們可以進(jìn)行非常好的互動(dòng)。
現(xiàn)在他們?cè)谧鲆恍┑卣鸱矫娴膽?yīng)用和研究也就是說他們希望用這個(gè)計(jì)算集群的算法來幫助一些油井公司來找到一些石油。在石油探測(cè)領(lǐng)域有一家公司叫HEADWAVE,他們也用了一些地理數(shù)據(jù),你可以看到這漲圖,他們是關(guān)于石油的產(chǎn)品,看了一下這些圖就問,應(yīng)該在哪兒進(jìn)行鉆井呢?你要決定的時(shí)候,服務(wù)器要處理很多的地理信息,HEADWAVE他們把這些相關(guān)的數(shù)據(jù)收集起來之后建立一個(gè)數(shù)據(jù)庫,非常大,之后需要一個(gè)工作站通過GPU來進(jìn)行數(shù)據(jù)處理。
VMD/NAMD分子動(dòng)力學(xué)領(lǐng)域也是先鋒領(lǐng)域,去年我們的首席技術(shù)官,他說我在這個(gè)課上學(xué)了一點(diǎn)兒東西,之后可以用在視頻分子動(dòng)力學(xué)的設(shè)計(jì)中,包括分子,還有細(xì)胞,還有細(xì)菌動(dòng)力的分析。之后他發(fā)布了一款工具,在我們的網(wǎng)站上進(jìn)行發(fā)布,用了一個(gè)標(biāo)準(zhǔn)的工作站,3GPU的設(shè)計(jì),基本上能夠達(dá)到非??焖俣鹊倪@也是令人吃驚的研究。在美國如果用一家最先進(jìn)的研究機(jī)構(gòu),也要花很長時(shí)間,很多的科學(xué)家來進(jìn)行研究才能得到這樣的結(jié)果。
再看一下Matlab,這個(gè)實(shí)驗(yàn)室都所有的工程師來說,他們?cè)谶@里使用CPU+GPU,通過使用這個(gè),性能得到了17倍的提升,人們可以把電腦作為一個(gè)計(jì)算工具來使用。我們做了一個(gè)研究代碼,通過CUDA可以使用這個(gè)加速17倍,以前需要3天,現(xiàn)在只需要3個(gè)小時(shí)的時(shí)間,他們一周可以做兩次模擬,現(xiàn)在總的來說這個(gè)研究速度得到了很高的提升。
簡單介紹一下我們?cè)诮鹑陬I(lǐng)域中的應(yīng)用,金融領(lǐng)域是一個(gè)非常有趣的領(lǐng)域,尤其對(duì)高量數(shù)據(jù)的處理來說,對(duì)電腦的要求也非常高,我們?cè)诿绹梢栽谝幻腌姲衙绹械钠跈?quán)進(jìn)行處理,可以評(píng)估美國所有的股票期權(quán),所以基本上是實(shí)時(shí)的可以處理這個(gè)結(jié)果。
再看一下Level3,他們也有很多的不同的期權(quán)不同的證券,他們也采用這個(gè)技術(shù)對(duì)七千進(jìn)行分析。這我們一個(gè)研究人員做的標(biāo)桿性的研究,它的性能可以比普通的電腦的速度要提高好幾百倍。所以總的來說,對(duì)GPU來說,在未來重要領(lǐng)域的應(yīng)用非常有前景。
這張圖是地理信息系統(tǒng),或者是多重地理信息系統(tǒng)。在很多領(lǐng)域都可以應(yīng)用,比如說你想做城市規(guī)劃,建一些社區(qū),房屋、道路的設(shè)計(jì),這些的城市規(guī)劃人員可以用地理信息軟件或者技術(shù)來分析相關(guān)的人口信息和地理信息之后來決定是否在那里建一些醫(yī)院或者房屋等等。比如說應(yīng)該在哪個(gè)地方建立一些街道,還有我的電廠應(yīng)該在哪兒,這個(gè)軟件可以制作出一些地圖,疊加上人口信息,住房、人口、公路等等描述這個(gè)區(qū)域,這樣可以和地質(zhì)規(guī)劃人員,城市規(guī)劃人員進(jìn)行互動(dòng),規(guī)劃人員可以使用GPU正確的設(shè)計(jì)出道路,可以打造更加高效的城市。
另外就是關(guān)于天體物理學(xué),很久以前,有一系列的天體物理學(xué)家,他們覺得天體物理學(xué)能夠通過GPU來加速,在日本也使用了這個(gè)項(xiàng)目,他們使用了GPU之后效果非常不錯(cuò)。
再看一下曼德爾布羅特,這個(gè)很難做,它是一種非常簡單的應(yīng)用,我們?cè)诰W(wǎng)站上也是由學(xué)生開發(fā)的,他每天給我們打電話,發(fā)郵件,希望能夠得到一個(gè)板塊,之后我們給了他一塊兒,馬上就給我們做了曼德爾布羅特的模擬,所以現(xiàn)在已經(jīng)在我們的SDK上發(fā)布了,也就是對(duì)我們的工具包里對(duì)我們的開發(fā)人員進(jìn)行了正式公布。
給大家看一下演示,這是用筆記本電腦做的,這個(gè)用的G80的GPU,這是它的編碼,速度不是很慢,總而言之是手提電腦,負(fù)責(zé)大家對(duì)這個(gè)游戲比較感興趣,實(shí)際上也進(jìn)行了細(xì)節(jié)性的模擬,模擬水面的波紋。接下來一張,這是天體物理,實(shí)際上它是實(shí)時(shí)的模擬,也是用筆記本電腦做的,你可以看到在這上面,大概有35G浮點(diǎn),但是整體的價(jià)錢不貴,僅僅900美元,所以任何物理學(xué)家都可以做比較有趣的模擬。另外有一點(diǎn),它也是8800 GTX的基礎(chǔ)上設(shè)計(jì)的,它是在16GPU的體系上進(jìn)行操作的,實(shí)際上也可以在筆記本電腦上進(jìn)行運(yùn)行,因?yàn)樗容^穩(wěn)定。你可以看到這個(gè)就是GPU的好處。
這個(gè)比較有趣,但是給大家展示另外一個(gè)角度,基本是是從工業(yè)應(yīng)用的角度上來展示的,有一些領(lǐng)域大家在Walter 的發(fā)言中也看到了,就是視覺的領(lǐng)域,我們是怎么做的呢?我們首先有一個(gè)和電腦連接的攝像機(jī)之后進(jìn)行過濾,在CPU和GPU之間進(jìn)行過濾,點(diǎn)一下CPU,先點(diǎn)上面再點(diǎn)下面,你看數(shù)字比較少,但是你可以看到這個(gè)電腦上有10個(gè)飛行演示,所以對(duì)筆記本電腦來說,一個(gè)比較一般性的CPU加一個(gè)GPU的話就可以進(jìn)行8次的飛行演示??梢钥吹竭@個(gè)圖像還是比較清晰的,我們?cè)倏醋詈笠稽c(diǎn)。這個(gè)圖像在CPU不太可能實(shí)現(xiàn),基本上是通過GPU可以實(shí)現(xiàn),這叫光流,也就是CPU來分析一下這個(gè)屏幕上的一些投射。我們?cè)贑PU上是不能夠做,比如說你可以看到一些色彩的損失,所有這些小的紅點(diǎn),基本上都是小的三角,這些小三角能夠感知到屏幕上物品的運(yùn)動(dòng),而這個(gè)矢量還有三角形的大小就是這個(gè)矢量,這在CPU上不能做,CPU只能做區(qū)域性的分析。所以,你可以看到對(duì)CPU電腦來說,你可以看到一塊兒一塊兒的東西,不能真正做細(xì)節(jié)的圖像描述。但是,這也是在筆記本電腦上做的。
『NVIDIA專業(yè)顯卡及解決方案展示區(qū)』
我們?cè)倏匆幌耇esla產(chǎn)品線,我們會(huì)繼續(xù)發(fā)展GPU,也會(huì)繼續(xù)朝筆記本電腦方向進(jìn)行進(jìn)一步的探索,但是在Tesla方面我們希望真正的有所探索。第一個(gè)就是工作站,我們有一些科學(xué)家和工程師他們有電腦,這樣我們可以桌面和桌邊型計(jì)算機(jī)上實(shí)現(xiàn)超級(jí)計(jì)算機(jī)的性能,我們給他們建立新的服務(wù)器,來滿足他們大規(guī)模計(jì)算的需求。另外,工作站的計(jì)算集群,也就是說在桌面計(jì)算機(jī)上可以建立一個(gè)標(biāo)準(zhǔn)的工作站。
接下來是關(guān)于服務(wù)器的,你可以看到這里有4個(gè)GPU,它的高度大概是1U的尺寸,可靠性比較高,同時(shí)對(duì)數(shù)據(jù)管理中心來說,之前的可能有4000多個(gè)服務(wù)器,有很多GPU,對(duì)管理人員來說怎么能夠看到哪個(gè)地方有些問題,比如說有一些風(fēng)扇散熱出了問題,那個(gè)地方怎么辦呢?GPU可以自我管理,自我處理,所以你可以看到密度比較高,目標(biāo)性能比較高,同時(shí)尺寸比較小,同時(shí)自我管理能力比較高。這是我們數(shù)據(jù)中心計(jì)算系統(tǒng),對(duì)Tesla來說服務(wù)器是怎么做的呢?
你可以看到軟件能夠把軟件和CPU連接起來,這是有一個(gè)服務(wù)器,有兩個(gè)小的適配卡,放入服務(wù)器中,還有一些電纜,把GPU系統(tǒng),目前有4個(gè)GPU,通過CPI的轉(zhuǎn)換器進(jìn)行連接,這樣可以把PCI,GPU和CPU連接起來。
這有4個(gè)8系列GPU,第二個(gè)是2個(gè)GPU,這是服務(wù)器解決方案是4個(gè)GPU,工作站就是兩個(gè)或者一個(gè)。剛才我簡單介紹了我們?cè)趺磻?yīng)用CUDA,怎么應(yīng)用計(jì)算的。今年你可以看到GPU在CUDA這方面會(huì)有進(jìn)一步的進(jìn)展,我們希望能夠建立一些新的平臺(tái)新的環(huán)境,希望能夠更好的提高計(jì)算速度。
謝謝大家。
#p#page_title#e#
第8頁:NVIDIA CUDA技術(shù)媒體介紹會(huì)——Andy篇(上)
時(shí) 間:2008年1月17日(11:00—12:00)
地 點(diǎn):北京麗思卡爾頓酒店
魏鳴:今天Andy在他的主題演講大部分介紹了CUDA的情況,在這里媒體有問題他來回答,他先介紹一下今天早上的內(nèi)容,再給大家重新總結(jié)一下。
Andy Keane:今天上午我總結(jié)一下,我們主要介紹了CUDA。另外,在07年我們主要推出了兩個(gè)最主要的技術(shù),一個(gè)是CUDA,他是用新的編程環(huán)境,是對(duì)GPU編程,對(duì)一般的開發(fā)人員,通過使用CUDA能夠使用GPU來編程,以前開發(fā)使用CPU,C或者C++語言來編程,通過CUDA他們可以使用GPU來編程。
CUDA這個(gè)產(chǎn)品一大特點(diǎn)就是它能夠建立這樣比較好的軟件環(huán)境,一方面能夠使串行的處理成為可能,另一方面也能夠使并行的處理成為可能,這樣串行的CPU可以用順序處理一些數(shù)據(jù),同時(shí)也把量比較大的數(shù)據(jù)分成不同的塊兒,GPU可以通過并行的方式進(jìn)行處理,總的來說CUDA建立一個(gè)比較好的軟件環(huán)境,同時(shí)使CPU和GPU并行數(shù)據(jù)處理成為可能。
另外,對(duì)CUDA來說比較有特色的一點(diǎn)就是它是通過把CPU并行起來一樣,讓CPU來處理不同塊兒的數(shù)據(jù),也就是說通過軟件,CPU在處理的時(shí)候通過軟件來處理,也就是把不同的問題,或者不同的數(shù)據(jù)并行起來,通過管理不同的現(xiàn)在線程用軟件來處理問題,有的時(shí)候有困難,如果通過軟件管理和處理線程的話,為什么采用GPU呢?因?yàn)镚PU實(shí)際上是在建立就把管理的問題解決掉了,假設(shè)輸入一大堆程序或者信息,這時(shí)候GPU就會(huì)主動(dòng)的進(jìn)行計(jì)算,同時(shí)對(duì)這些線程進(jìn)行分析和計(jì)算,再反饋給你答案,這時(shí)候GPU只負(fù)責(zé)計(jì)算不負(fù)責(zé)管理,所以速度要快,而且更簡單一些。
『NVIDIAGPU計(jì)算事業(yè)部總經(jīng)理Andy Keane先生向參會(huì)媒體介紹專業(yè)顯卡優(yōu)勢(shì)及發(fā)展歷程』
另外,再說完最后一點(diǎn)大家就可以討論,我手上已經(jīng)有大家提出的一系列問題,討論問題的清單,這些問題問的非常好,都是關(guān)于軟件環(huán)境的,CUDA作為一個(gè)工具,目前僅僅處于開始的階段,這也是為什么我們現(xiàn)在用簡單的語言環(huán)境下利用CUDA,也就是C,這對(duì)很多的開發(fā)人員里說,他們就會(huì)更容易使用GPU,因?yàn)镃語言對(duì)他們來說非常容易,大家都會(huì)。這只是一類開發(fā)人員,在未來我們還會(huì)在新的工具,其他的高級(jí)語言上來使用CUDA,那時(shí)候我們可能會(huì)有一些新的設(shè)計(jì),或者新類別的CUDA的應(yīng)用。
比如說一些高級(jí)語言現(xiàn)在就可以并行處理一些數(shù)據(jù),我們就在CUDA的基礎(chǔ)上,因?yàn)镃UDA實(shí)際上是一種渠道,讓程序員能夠利用CUDA接觸使用GPU,在未來新的高級(jí)語言上,我們利用CUDA之后,整個(gè)的處理速度將會(huì)更快,比如說在C++語言上,我們可以把整個(gè)環(huán)境架構(gòu)在CUDA之上,或者整個(gè)驅(qū)動(dòng)之上。CUDA應(yīng)該在利用GPU的計(jì)算能力上,最底層的軟件環(huán)境,其他的語言就可以在這個(gè)基礎(chǔ)上進(jìn)行應(yīng)用了。
根據(jù)你們提的問題的清單,我也提大家感興趣得主題,大家想知道為我們要選擇CUDA,為什么要用CUDA,設(shè)計(jì)出CUDA的目標(biāo)是什么,應(yīng)用是什么,世界上在科學(xué)界、工業(yè)界大家都知道CUDA有比較好的應(yīng)用。大家比較感興趣的是對(duì)普通的消費(fèi)者來說,CUDA是不是有一定的未來可以使用呢?另外今天上午也做了一些小的演示。
舉個(gè)例子,就像筆記本電腦一樣,今天介紹關(guān)于天文物體學(xué)的設(shè)計(jì)和演示,實(shí)際上它能夠處理35G浮點(diǎn)的處理速度,就像手提電腦一樣,10—15年前尺寸相當(dāng)于一個(gè)大的房間,還是很笨拙的,現(xiàn)在可以處理視頻、音頻還有其他的應(yīng)用等等,所以潛力還是比較巨大的。CUDA也是一樣,我們僅僅推出一個(gè)初級(jí)的版本,或者剛推出的版本,在未來隨著性能不斷地提高,我們會(huì)推出下一個(gè)版本,再下一個(gè)版本,這樣不僅僅是程序員、科學(xué)家、工業(yè)人員他們可以使用CUDA進(jìn)行設(shè)計(jì),包括普通的消費(fèi)者你們也可以利用CUDA來進(jìn)行自己的設(shè)計(jì)。超級(jí)計(jì)算,以前是在很大的電腦上運(yùn)行,現(xiàn)在由于有了這些先進(jìn)的GPU的技術(shù)和CUDA的技術(shù),就可以在自己的電腦上,完成很高的科運(yùn)算。現(xiàn)在,大家有任何問題可以提出。
記者:我理解CUDA技術(shù)是NVIDIA動(dòng)態(tài)負(fù)載平衡技術(shù),并且通過驅(qū)動(dòng)程序來實(shí)現(xiàn)的,可能是比較靈活,這種方式必須是用緩存技術(shù)來優(yōu)化推進(jìn)或者是同步計(jì)算?它依賴緩存技術(shù),這種方式最終會(huì)不會(huì)以芯片內(nèi)制的方式整合到芯片當(dāng)中來實(shí)現(xiàn)呢?
Andy Keane:實(shí)際上對(duì)于很多圖形的站來說,復(fù)雜的因素都是在GPU里面的,圖形和計(jì)算基本的應(yīng)用是一樣的,在GPU里面有一些核心的應(yīng)用,或者說核心的程序,通過驅(qū)動(dòng)連接到CPU,基本上通過一個(gè)通道來平衡CPU和GPU,這個(gè)所謂通道就是我們所謂的芯片和芯片組,比如說你可以把一些軟件,包括一些應(yīng)用程序,包括驅(qū)動(dòng),也就是CPU的軟件連接到GPU的內(nèi)核上,通過通道。但是總的來說,未來不會(huì)有太大的變化,不會(huì)出現(xiàn)芯片內(nèi)制的狀況,還會(huì)保持現(xiàn)狀。
記者:第一,關(guān)于GPU,咱們新的工具跟CPU和GPU的聯(lián)系非常緊密,我們?cè)贑PU這方面得到的支持有多大?比如說得到AMD和Intel的支持有多大?第二,我們有一個(gè)相關(guān)的社區(qū),這個(gè)社區(qū)里面我們相關(guān)的東西會(huì)不會(huì)用開源的模式推廣,另外會(huì)不會(huì)對(duì)進(jìn)入這個(gè)社區(qū)對(duì)開發(fā)人員有一個(gè)獎(jiǎng)勵(lì)的機(jī)制?
Andy Keane:簡單介紹一下GPU和CPU處理的數(shù)據(jù)是各不相同的,解決的問題也是不同的,對(duì)GPU來說它處理一些比較類似統(tǒng)一的數(shù)據(jù),能夠平行一塊兒的形式批量處理,但是對(duì)CPU來說,它是一種順序的方式處理一些少量的但是各不相關(guān),不同的數(shù)據(jù)。比如說在我們操作系統(tǒng)中,你們會(huì)經(jīng)常看到,我們的CPU來處理鍵盤,還有你們的文檔等各種不同的程序,這是非常小的。各不相關(guān)的,基本上是CPU來處理。在實(shí)際應(yīng)用中兩個(gè)內(nèi)容都包括了,有的需要并行的處理一些數(shù)據(jù),有的需要串行的處理一些數(shù)據(jù),所以就需要我們要找到一個(gè)平衡。比如說對(duì)于你的手提電腦來說,基本上很大程度上使用的是CPU的處理,比如說各方面。在圖像和MP3這方面使用GPU進(jìn)行處理。另外在油井開發(fā)、地理信息這些工業(yè)應(yīng)用中,并行處理的數(shù)據(jù)很多,因?yàn)樾畔⒘勘容^大,都是比較類似的,但是需要以順序處理的方式的數(shù)據(jù)比較少,所以在不同的行業(yè)不同的應(yīng)用中我們都會(huì)找到不同的平衡。
記者:AMD也購并了一個(gè)企業(yè),會(huì)不會(huì)對(duì)CUDA技術(shù)進(jìn)行一些限制?會(huì)不會(huì)影響CUDA的應(yīng)用。第二,Intel始終想跟NVIDIA這塊兒有合作,如果在這方面你們推出來CUDA是想在高端這塊兒有一些影響,Intel會(huì)不會(huì)對(duì)你們有一些限制,如果不得到這兩個(gè)公司的支持,CUDA在跟CPU的接觸中會(huì)有一些脫節(jié),這樣的話GPU的能力就很難發(fā)揮出來,或者說即使GPU的能力發(fā)揮出來了,CPU也很難。
Andy Keane:實(shí)際上對(duì)于AMD來說,他們和CUDA在某種程度比較類似,他們的軟件環(huán)境比較類似,所以基本上娓娓道來我們預(yù)測(cè)他的代碼也好,軟件也好,將會(huì)非常類似于CUDA的一些代碼和軟件?,F(xiàn)在他只是把一些相關(guān)的部分拿出來放到他們的芯片中,因?yàn)槲覀兊男酒灰粯樱珻UDA和AMD是不一樣的,他們就把類似的因素拿出來放到芯片中。但是基本上我們是屬于一個(gè)俱樂部,因?yàn)槲覀兊募夹g(shù)也是一樣的,軟件也是一樣的,未來他們有所發(fā)展對(duì)我們并是一種威脅。
關(guān)于Intel,他們的軟件采用多核的CPU技術(shù),但是由于他們多核的存在,他們的運(yùn)行問題太多了。為什么呢?因?yàn)槌绦騿T們總是要處理很多多核的運(yùn)算還有設(shè)計(jì),處理多重的線程,你編的軟件要在不同的線程上運(yùn)行,而且能在2、4、6個(gè)不同的處理器之間靈活的轉(zhuǎn)換,這已經(jīng)是非常難的事情。所以,對(duì)Intel多核電腦來說可靠性比較低,作為媒體你們也經(jīng)常報(bào)道,多核技術(shù)總是問題比較多,已經(jīng)成為他們往前發(fā)展的一個(gè)障礙了。
我們有很多的挑戰(zhàn)需要去解決,一個(gè)好的軟件開發(fā)員利用多核來做的話,它的穩(wěn)定性,因?yàn)橐卸嗑€程來開發(fā),穩(wěn)定性就會(huì)有問題,很多問題需要去解決。
另外也想強(qiáng)調(diào)一點(diǎn),在這個(gè)軟件環(huán)境下,我們并不準(zhǔn)備代替或者替代軟件中的多核CPU,為什么?因?yàn)樵谖磥矶嗪说腃PU還在運(yùn)行系統(tǒng)中運(yùn)行,同時(shí)GPU只是負(fù)責(zé)處理那些非常大的,海量的而且需要快速處理的數(shù)據(jù),它的功能主要是在不替代CPU的前提下,來主要負(fù)責(zé)處理大量的數(shù)據(jù),而大量的線程仍然是存在CPU上??偟膩碚f,CPU和GPU共存,在未來GPU處理大量的音頻、視頻還有圖像這樣一些數(shù)據(jù),但是CPU還會(huì)處理一些串行的內(nèi)容。
#p#page_title#e#
第9頁:NVIDIA CUDA技術(shù)媒體介紹會(huì)——Andy篇(下)
魏鳴:我們說的CUDA這個(gè)東西是怎么樣更好的利用GPU的計(jì)算能力去開發(fā)新的應(yīng)用出來,這在以前人們基于CPU來開發(fā)應(yīng)用程序,但是GPU的能力沒有被很好的開發(fā)出來,我們推出CUDA就是為了更好的利用GPU的計(jì)算能力,所以我們說的CUDA這個(gè)技術(shù)和其他的公司所談到的利用CPU來進(jìn)行的這種編程是不同的范疇,解決的問題不一樣。就剛才說的CPU和GPU的運(yùn)行模式也不一樣,所以他們之間不是對(duì)立,是并存在一些解決不同的問題。
Andy Keane:CUDA作為一個(gè)軟件,CUDA是用C程序基礎(chǔ)上的一個(gè)軟件,他可以在不同的市場(chǎng)上應(yīng)用,比如說GeForce一些應(yīng)用市場(chǎng)等等,但是對(duì)工業(yè)或者高端的大量數(shù)據(jù)處理的領(lǐng)域來說,應(yīng)該是Tesla這個(gè)產(chǎn)品。我們有兩個(gè)競(jìng)爭(zhēng)對(duì)手,其中有一個(gè)是FPGA,這個(gè)時(shí)候大家就問這個(gè)問題,為什么我們會(huì)選擇CUDA而不選擇FPGA,對(duì)程序員來說他要選擇程序運(yùn)行的時(shí)間有多長,對(duì)FPGA來說,如果發(fā)生變化是要在芯片方面發(fā)生變化,所以它只能解決一些非常特殊的問題,在某些問題的解決上,F(xiàn)PGA的性能比較好,但是問題是可編程性比較差。
魏鳴:CUDA跟編程語言的區(qū)別,比如說金融業(yè)方面你要分析證券,如果用FPGA就要有變化要重新設(shè)計(jì),用CUDA不需要重新設(shè)計(jì),改變程序就可以了,這樣便于開發(fā)人員應(yīng)用,而且可編程性更強(qiáng)了,這是主要的區(qū)別。
記者:如果使用CUDA的話,這個(gè)程序員是不是要在開發(fā)習(xí)慣上有所改變?
Andy Keane:總的來說,CUDA解決的是并行的計(jì)算的一些問題,實(shí)際在CUDA出現(xiàn)之前有很多其他的技術(shù),也出現(xiàn)并且目的是為了解決這些問題,這些問題是并行大量的數(shù)據(jù)處理,也是早就存在的,這也是為什么出現(xiàn)了多核處理器,出現(xiàn)了FPGA等等其他的技術(shù)。就像看一本書一樣,作為CPU會(huì)一頁一頁過這些書,再把相關(guān)的詞找出來。但是GPU就很簡單,把整個(gè)書分成好幾塊兒,同時(shí)并行處理這些內(nèi)容找到你的目標(biāo)??偟膩碚f,這個(gè)問題的設(shè)計(jì),這個(gè)思維,這個(gè)概念才是最主要的,編程也很重要,但是和設(shè)計(jì)相比不像設(shè)計(jì)那么重要,設(shè)計(jì)是核心的。所以,在程序上可以通過CUDA,可以通過多核或者FPGA來解決,但是對(duì)程序員來說需要在思維上有所改變,在程序操作上不用做太大改變。
魏鳴:軟件不需要做改變,只是在擴(kuò)充編程的時(shí)候要從硬性的角度考慮這個(gè)問題,這個(gè)才是最重要的。
記者:我有三個(gè)問題。第一,CUDA在圖形編程方面和現(xiàn)有的圖形開發(fā)環(huán)境,比如說OpenGL在做圖形編程的時(shí)候是否會(huì)有沖突?只能用其中一種。第二,使用CUDA這種應(yīng)用程序是不是只能在NVIDIA的硬件平臺(tái)上?如果是的話,我覺得未來可能出現(xiàn)多種GPU接口的標(biāo)準(zhǔn),是否有一種解決方案解決多種應(yīng)用平臺(tái)之間的兼容性問題。第三,CUDA是否能夠在移動(dòng)開發(fā)環(huán)境中應(yīng)用?比如說在手機(jī)上,現(xiàn)在有沒有計(jì)劃與手機(jī)的操作系統(tǒng)開發(fā)商有這種合作計(jì)劃呢?
Andy Keane:在設(shè)計(jì)上,我們CUDA在圖像處理這方面已經(jīng)考慮了要通過API,OpenGL所設(shè)計(jì)的圖像能夠兼容或者設(shè)計(jì)接口,首先建一個(gè)像素緩沖目標(biāo),后寫入API,整個(gè)過程還是比較容易實(shí)現(xiàn)。像之前的演示里面也是這樣一個(gè)概念,就是在圖形和CUDA之間,我們實(shí)際上找到一個(gè)平衡,天體物理學(xué)那個(gè)演示中大家能夠看到。因?yàn)橛械臅r(shí)候CUDA并不能處理所有圖的信息,而圖也不能處理CUDA所能夠處理的信息,因?yàn)镃UDA處理信息比較獨(dú)特,那些非結(jié)構(gòu)性的數(shù)據(jù),包括字符和一般性的數(shù)據(jù),對(duì)圖來說,處理的數(shù)據(jù)更加具體更加特定,所以我們?cè)谠O(shè)計(jì)上也考慮了不同的因素組合起來。
第二個(gè)問題,CUDA剛剛開始是我們公司的產(chǎn)品,我們也會(huì)基于我們公司的產(chǎn)品推廣這個(gè)技術(shù),但是CUDA在計(jì)算領(lǐng)域里,只有開放式的架構(gòu)和技術(shù)才能夠有生命力,所以CUDA會(huì)慢慢的把它在CPU上運(yùn)行,或者在其他的GPU上面運(yùn)行,這肯定是以后的趨勢(shì)。但是,我們不會(huì)強(qiáng)調(diào)行業(yè)接受這個(gè)技術(shù),而是有這樣一個(gè)平臺(tái),這樣一個(gè)技術(shù)讓大家一塊兒來開發(fā)。將來有一個(gè)情況就是其他的人采用它,可能會(huì)有其他的標(biāo)準(zhǔn)出來,我們一塊兒互相結(jié)合在一起做,所以還會(huì)是行業(yè)性開放性的技術(shù),發(fā)展方向應(yīng)該是這樣的。
第三個(gè)問題,CUDA對(duì)移動(dòng)設(shè)施來說是高中端的產(chǎn)品,但是它的體積比較小,對(duì)CUDA來說目前是嵌入GPU的技術(shù),或者是什么也好,我想未來技術(shù)可能會(huì)用在手機(jī)上,但是可能要經(jīng)過幾代,直到技術(shù)允許它的尺寸可以縮小到一定的大小,另外需要的電源,還有各方面的需求可以滿足手機(jī)需要的時(shí)候,但是中間可能要經(jīng)過一段時(shí)間。
Andy Keane:應(yīng)用于計(jì)算機(jī)的計(jì)算技術(shù),你最后看到在你手機(jī)上需要花幾年,因?yàn)槟阋獪p少功耗才能用,現(xiàn)在在高端的,GeForce 8系列可以用,慢慢會(huì)一步步的推進(jìn)。
記者:我們公司現(xiàn)在倡導(dǎo)通用GPU計(jì)算,我們有沒有在這方面有更多的實(shí)驗(yàn)運(yùn)行?是不是需要更多開發(fā)部來支持新的通用計(jì)算?
Andy Keane:我們首先定義一下什么叫做通用計(jì)算?通用計(jì)算基本上通過CG或者OpenGL,或者其他的圖形語言進(jìn)行圖形的計(jì)算問題,一般我們會(huì)把紋理作為一些資料來進(jìn)行輸入之后,把這些數(shù)據(jù)進(jìn)行分析,可能產(chǎn)出的就是紋理的顏色等等各種分析結(jié)果,CUDA主要采用C編譯器,我們也有自己的一些庫,但是總的來說是基于C語言的,是不是還會(huì)建立其他的庫開發(fā)新的功能?基本上在C編譯器上,不是真正有所謂的庫,基本上就是C編譯器上的開發(fā)。
記者:在Gelato里面是不是應(yīng)用了CUDA,如果不是的話,CUDA是不是開發(fā)了圖像方面的軟件?CUDA是不是用于開發(fā)游戲運(yùn)算中物理隱形方面的東西?
Andy Keane:在Gelato中沒有使用CUDA,其實(shí)Gelato開發(fā)之前就已經(jīng)存在開發(fā)好了,但是我們使用CUDA進(jìn)行開發(fā),這方面我們的確也有一些活動(dòng),但是具體是哪個(gè)產(chǎn)品我們不能告訴你,因?yàn)楫a(chǎn)品經(jīng)理不會(huì)同意我這么做,如果我要提前在他的產(chǎn)品出來之前就向你們宣布的話,他肯定不會(huì)高興的。實(shí)際上我們現(xiàn)在已經(jīng)有一個(gè)產(chǎn)品市場(chǎng)上可以看到,就是紋理壓縮的一個(gè)設(shè)施,或者說一個(gè)設(shè)備,主要是處理紋理還有圖像等等。主要是加強(qiáng)一些視覺上的效果,就這個(gè)渲染器我也不能做太多評(píng)論,但是總的來說它在渲染方面還是不錯(cuò)的。我們也做過一些試驗(yàn),但是我覺得很多開發(fā)商他們覺得物理卡價(jià)值并不高,而且興趣也不是很大,實(shí)際上有兩種方法來解決這個(gè)問題。一個(gè)就是用你的多核,物理卡的問題可以用多核CPU來解決,比如說你電腦里有4個(gè)核,一個(gè)是操作系統(tǒng),一個(gè)是游戲,還有兩個(gè)額外的核。另外有一部分的物理的特性可以通過GPU來解決,但是GPU實(shí)際上處理的是一些,比如說CPU適合游戲處理和游戲相關(guān)的深嵌程度比較深的物理特性,但是GPU處理的是形象,或者看起來怎么樣,或者說視覺效果等等。比如說在一款游戲里面,舉個(gè)簡單的例子,樹動(dòng)的時(shí)候使用的是GPU,因?yàn)樗鼘?shí)際上和打游戲沒什么關(guān)系,但是人跨過草叢的動(dòng)作就跟游戲的相關(guān)性更高,而且和AP的相關(guān)性更高,這個(gè)時(shí)候使用的就是CPU來進(jìn)行處理。
記者:第一,我發(fā)現(xiàn)有CUDA的GPU有128個(gè)內(nèi)核,就是說對(duì)一個(gè)程序員面對(duì)如此多的內(nèi)核開發(fā)的時(shí)候,他如何能夠知道他已經(jīng)充分利用了這128個(gè)內(nèi)核,也許他的程序?qū)懙牟缓?,沒有充分利用好,或者說他應(yīng)該再買一個(gè)新的GPU,而不是程序的問題。
第二,我發(fā)現(xiàn)對(duì)于CUDA并不是把一個(gè)C的代碼或者是它的程序直接翻譯成GPU的語言 ,而是中間通過PTS的編譯器。我就有一個(gè)問題,關(guān)于PTS編譯器,我們程序員是不是可以直接編輯PTS的代碼控制GPU,直接對(duì)硬件進(jìn)行操作,而不需要寫C語言。
安迪•凱恩:就程序員開發(fā)而言,實(shí)際上我們也準(zhǔn)備了一系列工具幫助程序員更好的利用資源進(jìn)行開發(fā),比如說我們有4個(gè)調(diào)節(jié)器,它是(GTP)的調(diào)節(jié)器,你通過調(diào)節(jié)器可以分析是不是哪個(gè)地方出問題了,如果出問題你可以一步式的解決,這樣的調(diào)節(jié)器是CPU式的調(diào)節(jié)器。另外,我們也有一個(gè)分析器,這個(gè)分析器能夠幫助你分析你的編碼效率怎么樣,資源是不是完全利用了,或者在128個(gè)處理器中是不是都被利用了,另外我們會(huì)有一個(gè)Excel表格,上面列入不同的信息,在你編程序之前可以利用這個(gè)表格更好的利用這些資源,更好的進(jìn)行程序開發(fā)。對(duì)于GPU來說,實(shí)際上它的處理速度你們已經(jīng)知道了,比CPU要快得多,但是我們采用一個(gè)中間語言叫PTS,主要是為了保證背后基層的GPU快速運(yùn)行的時(shí)候,整個(gè)系統(tǒng)還是穩(wěn)定的,從C語言進(jìn)行開發(fā)之后轉(zhuǎn)換到PTS,這個(gè)過程也是相對(duì)來說更穩(wěn)定,因?yàn)镚PU處理速度非常快,我們需要找到這個(gè)中間語言能夠穩(wěn)定。對(duì)我們來說,我們建議程序員還要用C語言來開發(fā),還是一個(gè)詞穩(wěn)定,用PTS來開發(fā)更大程度是一種工具和編譯器,讓你更好的接觸到一些數(shù)據(jù)。這實(shí)際上跟CPU也一樣,很少有人說真正的去編,基本上用一個(gè)編譯器來做,編譯器已經(jīng)很好了,它能夠保證這個(gè)系統(tǒng)的穩(wěn)定。
記者:我們有沒有開發(fā)更高級(jí)語言的計(jì)劃?
Andy Keane:我們本身不是軟件開發(fā)商,我們只是建立一個(gè)底層,讓更多的軟件開發(fā)商開展他們的東西。
#p#page_title#e#
隨著NVIDIA的Tesla品牌旗下的GPU(圖形處理器)運(yùn)算產(chǎn)品和CUDA軟件開發(fā)工具的使用者越來越多,為了更好地履行對(duì)客戶的承諾,NVIDIA公司開設(shè)了一個(gè)專門為高性能計(jì)算(HPC)開發(fā)人員提供服務(wù)的資源社區(qū)——CUDAZone。
CUDA是世界上唯一針對(duì)GPU(圖形處理器)開發(fā)的C語言開發(fā)環(huán)境。自2007年2月發(fā)布以來,CUDA幫助工程師、科學(xué)家、地球物理學(xué)家等科研工作者實(shí)現(xiàn)了許多新的、工作必備的海量信息處理,并且將處理速度大幅提升到了相當(dāng)于之前45至400倍。
CUDAZone站點(diǎn)將會(huì)成為專業(yè)人士、學(xué)者以及所有對(duì)CUDA和Tesla有興趣的人們的全球性交流中心。站點(diǎn)功能涵蓋編程技術(shù)發(fā)布、客戶聚焦、項(xiàng)目張貼和方法交流的論壇、CUDA工具的下載、代碼實(shí)例、新聞事件等諸多內(nèi)容。
NVIDIA的GPU計(jì)算事業(yè)部總經(jīng)理安迪۰凱恩(Andy Keane)表示:“自HPC社區(qū)成立以來,我們通過社區(qū)了解到客戶對(duì)CUDA非常支持。每天都有客戶發(fā)電子郵件告訴我們,他們的工作流程運(yùn)行速度得到了難以想象的提升。CUDAZone將會(huì)成為這些成果的聚集點(diǎn),并為我們的用戶提供一個(gè)集最新資訊、資源下載和數(shù)據(jù)更新于一體的平臺(tái)。”
欲了解更多信息以及下載CUDA SDK以及工具,請(qǐng)登錄www.nvidia.com/cuda。
Andy Keane—GPU計(jì)算事業(yè)部總經(jīng)理
Andy Keane先生于2006年加盟NVIDIA公司,出任NVIDIA公司全新的GPU計(jì)算事業(yè)部的總經(jīng)理,全面負(fù)責(zé)這一全新業(yè)務(wù)部門的組建,包括財(cái)務(wù)、銷售、市場(chǎng)運(yùn)作、產(chǎn)品規(guī)劃以及推廣等。
在加入NVIDIA之前,Andy Keane先生曾分別在Morphics及Ageia兩家公司的創(chuàng)業(yè)期任職市場(chǎng)副總裁,這兩家公司主要為電信以及消費(fèi)品行業(yè)開發(fā)并行計(jì)算技術(shù)。在此以前,Andy Keane先生曾為3dfx公司和QED公司的快速發(fā)展以及最后公開上市做出了卓越貢獻(xiàn)。其中,3dfx公司帶動(dòng)了消費(fèi)級(jí)3D圖形加速器的發(fā)展,而QED公司則是世界首批多核處理器供應(yīng)商之一。
不僅如此,Andy Keane先生在Xilinx公司早期進(jìn)行的可重配置計(jì)算以及FPGA系統(tǒng)的開發(fā)過程中,也發(fā)揮了重要作用。此外,Keane還曾任職于英特爾生產(chǎn)設(shè)計(jì)部門,從事容錯(cuò)并行計(jì)算技術(shù)的生產(chǎn)設(shè)計(jì)。
Andy Keane先生擁有伯克利商學(xué)院(Berkeley Business School)的MBA學(xué)位和倫斯勒理工學(xué)院(Rensselaer)的物理學(xué)學(xué)位。
Walter Mundt-Blum—專業(yè)解決方案事業(yè)部全球銷售副總裁
Walter Mundt-Blum先生1955年生于德國,1978年獲得電子工程碩士學(xué)位。在1978年至2000年間,Mundt-Blum先生任職于三菱電器歐洲公司,擔(dān)任歐洲外圍設(shè)備業(yè)務(wù)部門主管。
2000年至2002年,Mundt-Blum先生擔(dān)任艾爾莎(ELSA)公司專業(yè)圖形業(yè)務(wù)執(zhí)行副總裁。Mundt-Blum先生于2002年加盟NVIDIA公司,現(xiàn)今擔(dān)任NVIDIA公司專業(yè)解決方案事業(yè)部全球銷售副總裁。