您的位置：UltraLAB圖形工作站方案網(wǎng)站 > GPU圖形硬件技術(shù) > NVIDIA副總Walter談專業(yè)卡技術(shù)及行業(yè)客戶應(yīng)用狀況

NVIDIA副總Walter談專業(yè)卡技術(shù)及行業(yè)客戶應(yīng)用狀況

時(shí)間：2008-12-11 02:06:00 來源：UltraLAB圖形工作站方案網(wǎng)站 人氣：10233 作者：admin

第1頁：《戰(zhàn)狼》：當(dāng)神話遭遇視覺盛宴

NVIDIA Quadro 專業(yè)顯卡推動(dòng)了索尼電影公司所屬的Imageworks公司在最新的所有CG動(dòng)作電影中的創(chuàng)意工作。

如何能夠運(yùn)用技術(shù)手段將已有1200年歷史的古老史詩中描述的英雄、妖怪和巨龍?jiān)佻F(xiàn)在人們的眼前？這個(gè)問題就是導(dǎo)演Robert Zemeckis與索尼電影公司所屬的Imageworks公司（索尼Imageworks）在將《Beowulf（戰(zhàn)狼）》的故事搬上銀幕的過程中所面臨的挑戰(zhàn)。

Zemeckis 與索尼Imageworks的工作團(tuán)隊(duì)，使用了曾在《The Polar Express（極地特快）》中首次使用，并在《Monster House（怪獸屋）》中再次使用的“表演捕捉技術(shù)”，來講述英雄Beowulf（由Ray Winstone飾演）的故事。在這個(gè)故事中，Beowulf 來到Hrothgar國王（Anthony Hopkins 先生）的議事大廳，殺死長期以來一直為Hrothgar的王國制造苦難和災(zāi)難的妖怪 Grendel（Crispin Glover）。然而，在處決Grendel之后， Beowulf 就必須面對(duì)Grendel的母親（Angelina Jolie）因?yàn)閱首又炊貙⒉扇〉寞偪駨?fù)仇行動(dòng)。這個(gè)故事改編自被認(rèn)為是英國文學(xué)首部巨著的恢宏史詩。

“表演捕捉”運(yùn)用了演員的身體運(yùn)動(dòng)和面部表情的相關(guān)追蹤技術(shù)，然后將收集到的相關(guān)數(shù)據(jù)用于根據(jù)演員的表演創(chuàng)建動(dòng)畫場(chǎng)景。影片《Beowulf（戰(zhàn)狼）》的超常規(guī)模是這部作品的制作過程中遭遇的一個(gè)獨(dú)特挑戰(zhàn)。有些場(chǎng)景的人物角色達(dá)到了70多個(gè)，每個(gè)演員的動(dòng)作都必須進(jìn)行精準(zhǔn)捕捉、跟蹤，并且需要將其放置融入到動(dòng)畫角色的身上。然后再應(yīng)用紋理和照明效果，從而在攝影機(jī)布局過程中能夠讓導(dǎo)演實(shí)現(xiàn)實(shí)時(shí)互動(dòng)。

這種新的預(yù)覽技術(shù)增加了額外的相關(guān)挑戰(zhàn)。傳統(tǒng)的預(yù)覽技術(shù)使用簡單的、非紋理性幾何學(xué)來設(shè)置或計(jì)劃攝影機(jī)、演員和場(chǎng)景中動(dòng)作的所處位置。但是對(duì)于《Beowulf（戰(zhàn)狼）》這部影片來說，電影制作人員和索尼Imageworks的工作團(tuán)隊(duì)需要完成更多的工作。他們需要一種能夠表明情緒、照明細(xì)節(jié)和場(chǎng)景基調(diào)的預(yù)覽程序。因此，就需要實(shí)現(xiàn)和達(dá)到與頂級(jí)視頻游戲效果相類似的較高畫面質(zhì)量，而找到能夠應(yīng)對(duì)制作出實(shí)時(shí)高質(zhì)量畫面挑戰(zhàn)的顯卡產(chǎn)品才是解決這個(gè)問題的訣竅?！禕eowulf（戰(zhàn)狼）》的工作團(tuán)隊(duì)在NVIDIA的 Quadro專業(yè)顯卡產(chǎn)品家族中找到了他們理想的產(chǎn)品，這種顯卡可以提供對(duì)多個(gè)角色進(jìn)行紋理和照明實(shí)時(shí)渲染所需的處理動(dòng)力。憑借Quadro™解決方案，影片導(dǎo)演可在調(diào)度、拍攝和更改表演的實(shí)時(shí)進(jìn)程中，獲得自己需要的及時(shí)性反饋。

“Quadro顯卡具備生產(chǎn)我們?cè)诒硌莶蹲郊珊蛿z影機(jī)布局過程中所需要的實(shí)時(shí)場(chǎng)景能力。” 《Beowulf（戰(zhàn)狼）》的動(dòng)畫技術(shù)主管——Corey Turner 這樣說道。“我們有些場(chǎng)景非常復(fù)雜，有時(shí)需要對(duì)70多個(gè)角色的動(dòng)作進(jìn)行實(shí)時(shí)編輯和渲染， NVIDIA賦予了我們實(shí)時(shí)展示導(dǎo)演想法的能力。”

通過將Quadro專業(yè)圖形顯卡集成到他們創(chuàng)意作品之中，索尼Imageworks的工作團(tuán)隊(duì)實(shí)現(xiàn)了對(duì)復(fù)雜性很高的動(dòng)作場(chǎng)景的實(shí)時(shí)排列和渲染。工作人員們遇到的最為重大的挑戰(zhàn)之一就是Grendel在Hrothgar的議事大廳遭到攻擊的場(chǎng)景。這個(gè)場(chǎng)景的出鏡角色有70多個(gè)，還要由一臺(tái)移動(dòng)攝影機(jī)在大廳內(nèi)拍攝整個(gè)過程，Zemeckis在所有數(shù)據(jù)都已在實(shí)時(shí)3D 場(chǎng)景中進(jìn)行集成之后，決定了攝影機(jī)的拍攝位置以及表演動(dòng)作如何做出。盡管在所有表演中，最終只有一小部分可以在攝像機(jī)的拍攝范圍內(nèi)，不過，Quadro顯卡能夠讓導(dǎo)演在決定最終拍攝機(jī)位之前，對(duì)所有的角色進(jìn)行排列布局和渲染操作。

《Beowulf（戰(zhàn)狼）》這部影片的制作過程一直在挑戰(zhàn)Quadro顯卡的性能表現(xiàn)極限。最具挑戰(zhàn)性的拍攝之一是一段107秒的場(chǎng)景拍攝過程，在這個(gè)場(chǎng)景中，將近60個(gè)角色開始的時(shí)候在議事大廳跳舞，然后，這些角色的活動(dòng)地點(diǎn)又轉(zhuǎn)移到了議事大廳的房頂上面，隨后他們又穿過了四英里的鄉(xiāng)間小路，最后，拍攝工作在Grendel的洞穴中結(jié)束。由于需要對(duì)演員、道具進(jìn)行實(shí)時(shí)的完全照明和紋理渲染，所以，該項(xiàng)拍攝工作分為三個(gè)實(shí)時(shí)預(yù)覽片段進(jìn)行，然后再共同進(jìn)行回放編輯工作。然而，Zemeckis仍然能夠?qū)⑵渫昝赖剡M(jìn)行視覺演繹和展示，最后的成片中，整個(gè)拍攝工作看上去非常流暢完整、無懈可擊。
#p#page_title#e#
第2頁：NVIDIA專業(yè)圖形解決方案高端論壇——Walter演講（上）

時(shí) 間：2008年1月17日
地點(diǎn)：北京麗思卡爾頓酒店酒店大宴會(huì)廳

Walter Mundt-Blum：首先歡迎大家來參加我們的論壇，同時(shí)我也非常感謝大家對(duì)我們的產(chǎn)品特別是專業(yè)產(chǎn)品感興趣。我想向大家解釋一下我們公司是做什么的，有一些產(chǎn)品可能大家以前不知道，其實(shí)我們還做這個(gè)。我相信中國用戶對(duì)我們公司是非常了解的，我們有很多游戲方面的產(chǎn)品，甚至很多人給我們發(fā)來自己創(chuàng)作的NVIDIA相關(guān)藝術(shù)產(chǎn)品，包括照片等等的東西，比如說有人在雪上做了一個(gè)我們的LOGO。感謝他們對(duì)NVIDIA公司的巨大熱情。最有意思的是我們可以看這個(gè)小孩子的臉，這是來自歐洲的一張照片，他們的父母為問我們是不是可以把這個(gè)小姑娘起名為NVIDIA呢？我們對(duì)此沒有任何否定意見，還有其他的照片，比如說西瓜上有我們的LOGO等等。

很多人都知道我們?cè)谟螒蝾I(lǐng)域做出了很大的貢獻(xiàn)。那現(xiàn)在我們講一下我們?cè)趯I(yè)領(lǐng)域做哪些東西。我們這次過來主要希望向大家介紹兩個(gè)產(chǎn)品：一個(gè)是Tesla和CUDA，是我們公司推出的高性能計(jì)算的產(chǎn)品；另外一個(gè)是Quadro，我會(huì)來主講這方面的技術(shù)產(chǎn)品。

『NVIDIA專業(yè)解決方案事業(yè)部全球銷售副總裁Walter先生向參會(huì)媒體朋友介紹CUDA及專業(yè)顯卡產(chǎn)品』

在Tesla和CUDA這方面中，我們的GPU不在是負(fù)責(zé)圖形方面的工作，而是用在視覺計(jì)算。而在面向圖形方面的專業(yè)解決方案中，我們也不僅有板卡還有系統(tǒng)。比如說桌面系統(tǒng)，還有服務(wù)器的環(huán)境等等。換句話說，NVIDIA可以做很大的系統(tǒng)，不僅僅是一種普通的顯卡。

通過這張圖表我們可以看到，在工作站的整個(gè)發(fā)展過程當(dāng)中，我們所發(fā)售的GPU的數(shù)量比其他公司的產(chǎn)品總和還要多。同時(shí)這里有一個(gè)趨勢(shì)圖，2007年大家可以看到這是第三季度，而到2007年第四季度末我們?cè)趯I(yè)市場(chǎng)80%至85%的市場(chǎng)份額。如果把所有的產(chǎn)品加起來超過了所有其他競(jìng)爭(zhēng)對(duì)手同類產(chǎn)品的總和，從這點(diǎn)來說，我們?nèi)〉昧司薮蟮某删汀．?dāng)然這些成就的得來，也要非常感謝中國的市場(chǎng)，因?yàn)楸M管我們進(jìn)入中國時(shí)間非常短，在專業(yè)產(chǎn)品上僅僅兩年時(shí)間，我們已經(jīng)取得了很大的進(jìn)步。但是在國內(nèi)杰出的藝術(shù)創(chuàng)作中，90%都用到了NVIDIA GPU的設(shè)計(jì)。另外，我們的應(yīng)用領(lǐng)域也非常多，比如像空中客車A380，在我接下來的DCC演講部分當(dāng)中可以給大家看到，空中客車有一個(gè)超大的屏幕，是1：1的比例制作的。人們可以時(shí)時(shí)看到到底內(nèi)部的設(shè)計(jì)是什么樣，他們甚至可以走進(jìn)去，而這就要?dú)w功于我們的Quadro解決方案。還有蘭博基尼，還有阿迪達(dá)斯，可以讓他們看到這個(gè)鞋設(shè)計(jì)出來到底是什么樣子，產(chǎn)生時(shí)時(shí)的圖形。還有比如像歐寶，他們有汽車使用系統(tǒng)，通過這個(gè)系統(tǒng)歐寶可以提供比之前多27%的設(shè)計(jì)樣式。一年前，他們本來打算只有200個(gè)終端的建設(shè)，而現(xiàn)在有600個(gè)。保時(shí)捷也采用我們的產(chǎn)品進(jìn)行設(shè)計(jì)，還有其他公司有類似的做法，所以大家會(huì)看到越來越多的公司會(huì)用我們的產(chǎn)品做汽車的配置。

我們這個(gè)技術(shù)不僅僅是用于制造業(yè)，而且也非常重要的在電視行業(yè)，比如說我們有一個(gè)SDI的產(chǎn)品。大家看一下這邊的奧林匹克的滑冰，大家可以看到，實(shí)際上背后這個(gè)東西是由電腦計(jì)算機(jī)時(shí)時(shí)制作出來的，大家可以看到隨著這個(gè)人的出現(xiàn)，相應(yīng)的計(jì)算機(jī)技術(shù)制作出來會(huì)變化。而正因?yàn)槿绱?，我們獲得了艾美獎(jiǎng)，這是我們的CEO黃仁勛先生領(lǐng)取艾美獎(jiǎng)。還有在中國我們也知道有一個(gè)紀(jì)錄片叫《圓明園》，這是一個(gè)數(shù)字紀(jì)錄片，在中國是最大的一部數(shù)字紀(jì)錄片。也許我們可以看這個(gè)記錄片的一些視頻。

所有這些影像都是數(shù)字制作的，不是真的東西，我也非常高興請(qǐng)到了《圓明園》的導(dǎo)演金先生，下面我們請(qǐng)他來向我們解釋一下，他們是如何使用NVIDIA技術(shù)制作這么好的紀(jì)錄片。

金鐵木：各位大家好！《圓明園》這部分電影大概有人看過，在北京播了很長時(shí)間，其實(shí)從藝術(shù)的角度來講電影，電影需要技術(shù)的支持，我其實(shí)在技術(shù)方面屬于門外漢，非常不懂。但是在中國所有導(dǎo)演中，我一直致力于數(shù)字技術(shù)的，換句話說，我做的影片，有一大部分是要再現(xiàn)歷史，重現(xiàn)歷史，《圓明園》就是這樣的一部電影，沒有數(shù)字技術(shù)就沒有《圓明園》。

『電影《圓明園》導(dǎo)演金鐵木先生介紹電影編輯中采用NVIDIA專業(yè)顯卡的成功經(jīng)歷』

在電影中，我們最基本的要求在圖象處理方面我們而需要2K的技術(shù)，現(xiàn)在我們?cè)谧?K的電影，明年我們就要做6K的電影，現(xiàn)在我們?cè)谧鰥W運(yùn)會(huì)的開幕式及我們?cè)诙嗝襟w演示方面有8K的要求，這樣的要求對(duì)專業(yè)的圖形處理技術(shù)要求高，越來越高。所以，我覺得有了像NVIDIA這樣的公司，有了這樣的技術(shù)，有了這樣的專業(yè)的團(tuán)隊(duì)致力于這方面的開發(fā)，我們?cè)趯I(yè)的電影影像方面才有可能。我們運(yùn)算的能量，運(yùn)算最后達(dá)到的效果，才會(huì)達(dá)到我們所需要的，因?yàn)殡娪白詈蠖际且o觀眾看的，電影是NVIDIA這種圖形處理技術(shù)是通向觀眾的橋梁。我其實(shí)不是非常了解，我做技術(shù)的團(tuán)隊(duì)告訴我，說NVIDIA是業(yè)界最好的他們是做的最大的。希望NVIDIA做的越來越好，我們講做6K、8K電影的時(shí)候，希望NVIDIA的技術(shù)會(huì)讓我們更輕松。謝謝大家！

Walter Mundt-Blum：謝謝您，雖然我不能理解你說的東西，可以說是什么也不懂，但是我相信我們合作的還是非常不錯(cuò)，謝謝您！除了電影之外，我們同時(shí)也在垂直市場(chǎng)方面也非常知名，其中有一個(gè)就是在軍事技術(shù)方面，航空技術(shù)方面的GPU的技術(shù)。比如說向模擬系統(tǒng)，還有戰(zhàn)斗機(jī)，還有頭盔上面的攝像頭等等，我們的GPU也在用在這里面。

如果在設(shè)計(jì)產(chǎn)品，基本上希望在進(jìn)行生產(chǎn)之前，就知道到底它看上去怎么樣，它的功能怎么樣。如果不能模擬就會(huì)浪費(fèi)很多的時(shí)間和資源，這里有四個(gè)小例子?？梢越o大家一些印象我們到底跟我們的合作伙伴做哪些東西。這是空中客車，這是3D的虛擬化空間，到處都是投影機(jī)，上面、下面、后面都是投影機(jī)，這些投影機(jī)會(huì)投出3D的影像，你需要戴上3D的眼鏡進(jìn)這個(gè)房間，你感覺在這個(gè)房間里面，空中客車就設(shè)計(jì)了這樣一個(gè)空間，他的空間非常大。比如向新加坡航空公司，或者漢莎，他們就會(huì)到空中客車總部訪問，這時(shí)候空中客車就會(huì)向這些經(jīng)理人來展示和模擬新產(chǎn)品。

保時(shí)捷也在采用我們的技術(shù)，例如用尾燈的設(shè)計(jì)，保時(shí)捷用了RTT的產(chǎn)品，其中用到了我們的GPU，這是尾燈的設(shè)計(jì)。由于他們不希望進(jìn)行實(shí)物模型的制作，通過這種模擬就省了他們50萬美元的設(shè)計(jì)經(jīng)費(fèi)。因?yàn)橥麄兿Ｍ枰?—5個(gè)不同的設(shè)計(jì)，以往他們需要實(shí)物模型，而現(xiàn)在已經(jīng)徹底數(shù)字化了。

還有大眾，大家可能也知道，上海大眾在國內(nèi)的知名度，大眾有超大的屏幕，不僅僅是來模擬設(shè)計(jì)，同時(shí)還可以來模擬駕駛，比如說在設(shè)備和人之間的距離是多少，甚至是生產(chǎn)也可以進(jìn)行模擬。右下角這張圖，人們正在模擬制造一些維修，比如說你把這個(gè)車拿過來，發(fā)動(dòng)機(jī)在里面，而你在進(jìn)行維修的時(shí)候，你要換引擎，可能需要保證不需要?jiǎng)悠渌臇|西，就可以來對(duì)它進(jìn)行更換等等。所以，人們?cè)谟梦覀兊募夹g(shù)時(shí)更快的可以投入市場(chǎng)，并且也可以節(jié)省他們的資金。

在不久的將來，汽車導(dǎo)航系統(tǒng)不僅能幫他們導(dǎo)航，要到達(dá)他們想要到的目的地，同時(shí)也可以幫助人們，因?yàn)橄到y(tǒng)可以看，同時(shí)可以識(shí)別東西，待會(huì)兒Andy Keane會(huì)講到GPU計(jì)算，會(huì)講到GPU不僅僅是幫助顯示還有其它的用途。在這里我們可以看到，我們?cè)谲嚴(yán)镅b了GPU，你可以看到左邊有兩張圖，一張是車前面真正的機(jī)井，另外可以看到下面西門子授權(quán)的一個(gè)設(shè)計(jì)，前面裝了一個(gè)攝像機(jī)，真正來捕捉這些圖像，通過我們的導(dǎo)航系統(tǒng)，在屏幕上放一個(gè)箭頭，這樣就知道朝著前頭走。在右上角有儀表盤的設(shè)計(jì)，就是說在這不再是一種模擬的儀表盤，而是采用了全新的技術(shù)。這個(gè)數(shù)字儀表盤采用了比較高的分辨率，大概有1000—2000像素。而且你可以不斷地把功能來回的調(diào)換，有的時(shí)候你可以調(diào)成儀表，同時(shí)想換的時(shí)候，比如說想看一下你們前面攝像機(jī)設(shè)一些鏡頭和圖片的話可以調(diào)換。
#p#page_title#e#
第3頁：NVIDIA專業(yè)圖形解決方案高端論壇——Walter演講（下）

看下面這張圖上你可以看到這是一個(gè)新的技術(shù)，這個(gè)技術(shù)也是在美國開發(fā)的，這個(gè)技術(shù)能夠幫助我們捕捉一些圖像，之后把圖像改成數(shù)碼的，它甚至能夠做一些警報(bào)系統(tǒng)，假設(shè)顏色變紅的話，你可以看到前面可能有一些障礙物越來越近了，總的來說是一個(gè)比較好的預(yù)警系統(tǒng)。

我們?cè)谲嚴(yán)锩孀鲆恍〨PU，不僅在設(shè)計(jì)上，還有內(nèi)飾也會(huì)應(yīng)用到GPU的技術(shù)。另外跟圖形無關(guān)的高性能計(jì)算領(lǐng)域，GPU也有比較好的應(yīng)用，接下來我給大家介紹一下我們?cè)谶@方面的市場(chǎng)情況。

這張圖能夠讓大家非常容易的理解，可以看到運(yùn)輸界的高速提升，或者說吞吐量的高速提升，你可以看一下，之前大家使用航船來進(jìn)行交通，就是藍(lán)色線表現(xiàn)的階段，然后開始使用其他的交通工具。對(duì)于航船的速度提升是非常緩慢的，不是說一下子提升起來。你可以做一個(gè)航船的運(yùn)輸之后，兩個(gè)三個(gè)甚至可以加兩個(gè)…，太平洋、大西洋的運(yùn)輸。但是蒸汽輪船的發(fā)明將跨大西洋航行時(shí)間減少到了兩個(gè)星期，最短的時(shí)間可以接近一個(gè)星期。到了飛機(jī)被發(fā)明的時(shí)候，跨大西洋的航行在畫下了一個(gè)篇章。

對(duì)數(shù)據(jù)處理能力來說，你只用CPU來做數(shù)據(jù)處理可以看到，它的浮點(diǎn)的增長數(shù)比較點(diǎn)，所以人們之前用CPU進(jìn)行計(jì)算的時(shí)候，在絕對(duì)計(jì)算速度而言并不是很好，而當(dāng)人們使用CPU做其他的工作，并沒有真正用于計(jì)算。但是隨著時(shí)間的流失，GPU的運(yùn)算功能被發(fā)掘出來，比如說運(yùn)用化學(xué)領(lǐng)域，機(jī)損化學(xué)領(lǐng)域，以前需要花6天的時(shí)間做一些數(shù)據(jù)處理，現(xiàn)在不到30分鐘就可以處理了。對(duì)于神經(jīng)建模來說，如果只用CPU進(jìn)行出具處理得話，大概需要花2.7天的時(shí)間，現(xiàn)在用GPU只需要30分鐘。對(duì)于無線射頻模擬來說，以前要8小時(shí)的時(shí)間做模擬，模擬無線射頻，現(xiàn)在只需要13分鐘都不到的時(shí)間模擬。你可以看到浮點(diǎn)增長的速度隨著GPU技術(shù)的出現(xiàn)得到了很大的改進(jìn)。

我們不僅僅把這個(gè)技術(shù)應(yīng)用于工業(yè)領(lǐng)域，包括設(shè)計(jì)車內(nèi)的內(nèi)飾，同時(shí)我們也做一些醫(yī)學(xué)上的應(yīng)用。

你可以看到這張圖，大家看到的是超聲波對(duì)嬰兒胚胎的掃描，現(xiàn)在的掃描結(jié)果中我看不清也看不明白孩子在哪兒，如果你用我們的技術(shù)，可以真正的重現(xiàn)3D、2D的圖形，通過掃描就可以實(shí)現(xiàn)，這樣你可以看到體內(nèi)的嬰兒可以長什么樣子。你可以看到，通過GPU技術(shù)，你可以做3D、2D的轉(zhuǎn)換。我們?cè)卺t(yī)學(xué)領(lǐng)域可以在很多領(lǐng)域看到GPU的使用，不僅是圖像的使用，包括計(jì)算。

地質(zhì)學(xué)家也在這個(gè)領(lǐng)域進(jìn)行了一些分析，因?yàn)樗麄円幚淼脭?shù)據(jù)非常大，甚至有的時(shí)候會(huì)使用T字節(jié)級(jí)的數(shù)據(jù)進(jìn)行分析，看一下對(duì)石油的勘探來說，他們目前在使用我們的技術(shù)，比如說可以看到，你們通過對(duì)地面的一些探測(cè)的顯示，可以看到不同的層，搜集不同的數(shù)據(jù)，數(shù)據(jù)量比較大，假設(shè)用CPU計(jì)算可以花幾個(gè)月的時(shí)間處理這些數(shù)據(jù)，但是通過使用GPU，實(shí)際上速度要提高17—20倍左右，假設(shè)你用一個(gè)GPU的話，可能得使用20個(gè)CPU，所以GPU的功能要更為強(qiáng)大，尤其對(duì)數(shù)據(jù)處理來說。如果你要處理大量的數(shù)據(jù)，GPU可能是你選擇的技術(shù)。

在金融領(lǐng)域也是如此，在股票交易上GPU計(jì)算技術(shù)經(jīng)常會(huì)被使用，比如說人們要進(jìn)行金融風(fēng)險(xiǎn)的分析，這個(gè)時(shí)候可以用CPU來做一些分析，在GPU上面做數(shù)據(jù)分析，比如說每一次在GPU可以做15萬字的齊全模擬，非常精準(zhǔn)和高效。

另外一個(gè)非常有趣的領(lǐng)域就是GPU能夠使機(jī)器有一些認(rèn)知能力，比如說能看能聞，像狗能夠聞到癌細(xì)胞一樣。我們?cè)诿绹埠鸵患液腺Y公司進(jìn)行合作，做了一些分析，而且記錄出電腦的反應(yīng)情況。同時(shí)他們也開始對(duì)嗅覺進(jìn)行一些分析和模擬，模擬大腦的反映，他們用GPU的技術(shù)來教電腦來探來聞，所以我想在幾年之后我們將會(huì)看到他們的一些研究和制作成果。也就是說電腦可以真正來聞一些東西。

我們?cè)趺礃幽軌蚋献钚碌募夹g(shù)呢？為什么要將Quadro產(chǎn)品應(yīng)用在這些領(lǐng)域呢？Quadro實(shí)際上在設(shè)計(jì)產(chǎn)品方面有一些獨(dú)特的優(yōu)勢(shì)滿足我們客戶的有一些獨(dú)特需求，我們需要對(duì)他們的需求做定制的一些設(shè)計(jì)。比如像空客，還有一些其他的航空公司，他們?cè)诓煌碾娔X中使用同步鎖向，比如說SDI可以應(yīng)用電腦影片制作，Quadro Plex可以在PC上進(jìn)行高性能的GPU的應(yīng)用，我們希望能夠覆蓋一些城市設(shè)計(jì)的需求。就性能而言，我們優(yōu)化了Quadro，假設(shè)你看一下芯片，Quadro的芯片和其它GeForce的芯片基本上類似，但是在內(nèi)部有更多的晶體管，這樣你可以對(duì)Quadro做一些簡單的設(shè)計(jì)，把一些高級(jí)的原件進(jìn)行實(shí)效分析，和專業(yè)的應(yīng)用相比，Quadro的性能比較好，而且更為穩(wěn)定一些。

另外我們還和一些公司合作，來引證和驗(yàn)證相關(guān)的產(chǎn)品，比如說Autodesk，Adobe，這些公司對(duì)我們的驅(qū)動(dòng)進(jìn)行測(cè)試，同時(shí)給我們驅(qū)動(dòng)和硬件進(jìn)行認(rèn)證，但是對(duì)GeForce來說不太了解，所以不能進(jìn)行認(rèn)證和驗(yàn)證，他們的生產(chǎn)周期比較長，所以在Quadro中整個(gè)產(chǎn)品組合比較多，GeForce主要使用娛樂領(lǐng)域，速度是非常重要的，Quadro和它不一樣，GeForce速度有10%的變化，但是Quadro在啟動(dòng)24小時(shí)內(nèi)隨著時(shí)間功能會(huì)增加。

看一下GPU，比較一下Quadro和GeForce的性能比較和基本設(shè)計(jì)上的區(qū)別，你可以看到從這個(gè)垂直應(yīng)用角度來說，Quadro的性能是GeForce的5倍，尤其是它通過Shader Model 4.0、OpenGL和DX10，進(jìn)行了性能加速的提高，我們更多關(guān)注垂直市場(chǎng)，我們也和很多的公司客戶進(jìn)行聯(lián)系，包括國內(nèi)的一些大的公司，比如說浦東發(fā)展建設(shè)銀行，發(fā)展建設(shè)公司等等。還有很多大的客戶，我們也征求他們的需求，比如說你們未來6個(gè)月、12個(gè)月、24個(gè)月的需求是什么，我們把這些信息搜集起來給我們的設(shè)計(jì)人員作為參考。之后我們需要12—18個(gè)月的時(shí)間進(jìn)行設(shè)計(jì)這些產(chǎn)品，目前客戶有很多問題，我們可以幫他們解決這些問題，比如說給他們提供我們的獨(dú)立軟件供應(yīng)商還有我們的硬件合作商，包括聯(lián)想、HP，和他們一起幫助我們的客戶解決問題。

同時(shí)，我們也在教育我們的客戶，希望今年我們能夠把客戶教育的體系擴(kuò)展到中國，我們通過垂直市場(chǎng)，包括奧林巴斯，還有和其他的一些合作伙伴建立合作伙伴關(guān)系，同時(shí)也通過一些圓桌會(huì)議進(jìn)行討論，比如去年在德國大概有140名非常關(guān)鍵的IT人物在圓桌會(huì)議上跟我們共享了一些技術(shù)信息。

眼見為實(shí)，接下來我給大家放兩段小片子，給大家介紹一下目前通過我們的技術(shù)能夠做一些什么樣的事情。第一個(gè)關(guān)于實(shí)時(shí)光線追蹤的，在一年前需要200個(gè)或者是400個(gè)CPU做實(shí)時(shí)光線追蹤，現(xiàn)在只用一個(gè)系統(tǒng)就可以做。比如說看一下（蘭博基尼）的例子，這是一個(gè)（蘭博基尼）的車，這里面有反光鏡的影子，但是沒有真正的反射，但是你可以看到電腦在做一些計(jì)算，看一看反射的結(jié)果，你可以看到它從反光鏡里面做一些反射的計(jì)算，同時(shí)也做一系列的相關(guān)的計(jì)算，所以你可以看到以實(shí)時(shí)的方式能夠看到這些光線。這是通過一些追蹤的技術(shù)在進(jìn)行改進(jìn)，你可以看尾燈，保時(shí)捷當(dāng)時(shí)憑借對(duì)實(shí)時(shí)的追蹤，希望能夠?qū)ξ矡暨M(jìn)行光線追蹤，現(xiàn)在你可以通過這個(gè)技術(shù)，可以看到實(shí)時(shí)的尾燈光線追蹤，這個(gè)地方也一樣，這種實(shí)時(shí)的追蹤能夠給你一種更好的感知，在模擬過程中能夠更好的了解產(chǎn)品設(shè)計(jì)的結(jié)果是什么樣。

接下來就是一種提升的技術(shù)，這個(gè)提升的技術(shù)是什么，由于我有一個(gè)視頻，同時(shí)又一些3D的技術(shù)在一起，我們對(duì)RTT也做了一些研究，就是對(duì)實(shí)際的車輪的輪胎設(shè)計(jì)做了一些研究。你可以看到，這是攝像機(jī)把整個(gè)輪胎拍攝下來，在里面你可以看到有一些標(biāo)志點(diǎn)，這些標(biāo)志點(diǎn)被電腦使用。這個(gè)輪胎是真的，但是里面的輪轂是一個(gè)3D的制作，大家可以看到里面的反射，外面是真的，但是里面是3D的，這樣大家可以看到實(shí)時(shí)的輪胎在轉(zhuǎn)動(dòng)，到底設(shè)計(jì)在里面是怎么反映的。這個(gè)看上去已經(jīng)不錯(cuò)了，但是我們?cè)偌由系诙€(gè)像機(jī)在這里，它可以由計(jì)算機(jī)來反映的是一個(gè)光源在上面反射的狀況，所以大家可以看到，實(shí)際上我們公司進(jìn)入的領(lǐng)域是很多人不知道我們所在的領(lǐng)域，很多人只知道我們?cè)谟螒蚍矫孀龅姆浅２诲e(cuò)，我希望大家能夠把這些訊息傳達(dá)給你們的同事們還有其他人。就是NVIDIA不僅僅是做游戲產(chǎn)品的。

謝謝大家！希望大家今天過的愉快，而且我們?cè)诮裉靵淼姆謺?huì)場(chǎng)希望能夠再次看到大家
#p#page_title#e#
第4頁：NVIDIA媒體圓桌會(huì)——Walter演講（上）

時(shí) 間：2008年1月17日（13：30—15：00）
地點(diǎn)：北京麗思爾頓酒店

魏鳴：謝謝大家下午又回來這里，今天很多內(nèi)容要裝到腦子里，我們?cè)谏衔缭赪alter的主題演講里面，從更高的層面來講專業(yè)圖形解決方案對(duì)行業(yè)的影響對(duì)人生活的影響，下午有一些媒體，我們想更細(xì)的介紹一下Walter的解決方案，這個(gè)產(chǎn)品的特點(diǎn)，架構(gòu)是什么。所以下午注重技術(shù)型，同時(shí)也會(huì)講在某些垂直行業(yè)我們?yōu)槭裁醋龅暮?，為什么在這個(gè)市場(chǎng)里占有率是80%，我們是怎么做的這么深的，所以從這幾方面具體的解釋一下。他先有一個(gè)PPT的演講，然后是媒體問答。

Walter：首先介紹一下我自己，大家可能從我的名字也能看出，我并不是美國人我是德國人，但是我在美國工作，我在NVIDIA工作了7年，我之前在艾爾莎這個(gè)公司負(fù)責(zé)銷售和執(zhí)行總裁。在2000年的時(shí)候，雖然艾爾莎是最早在用NVIDIA的東西做工作站的產(chǎn)品，在那年也是NVIDIA收購了艾爾莎這個(gè)公司所有相關(guān)的資產(chǎn)，并且把開發(fā)人員也帶到了NVIDIA公司。

在之前我們只有Quadro和GeForce這兩個(gè)產(chǎn)品線，也可以說是兩個(gè)品牌，現(xiàn)在也就是9月之前我們推出了Tesla，大家早上已經(jīng)聽到了，我們現(xiàn)在已經(jīng)有了三個(gè)針對(duì)不同市場(chǎng)的三個(gè)產(chǎn)品線。GeForce主要是在娛樂游戲這塊兒的，Quadro主要是在專業(yè)DCC，還有垂直市場(chǎng)這塊兒，數(shù)字內(nèi)容創(chuàng)建等。Tesla主要在計(jì)算這塊兒，早上我同事跟大家介紹了有關(guān)Tesla這塊兒，下午我主要講Quadro這部分。

實(shí)際上我們可以看到這三個(gè)不同的產(chǎn)品線，它們不僅僅是品牌不同，而且芯片相關(guān)的技術(shù)也不一樣，相比較Tesla和GeForce，我們Quadro產(chǎn)品應(yīng)該說更超級(jí)的硬件的組合，因?yàn)槔锩嬗袑ｉT是用于OpenGL，還有一些專用的不同的驅(qū)動(dòng)，同時(shí)也支持AutoCAD。

這張圖上（PPT）大家可以看到有關(guān)Quadro的相關(guān)數(shù)字，我們?cè)贜VIDIA，加起來有15000人年的專業(yè)GPU經(jīng)驗(yàn)，到個(gè)月底，也就是說到我們這個(gè)財(cái)年接觸我們能夠出貨的針對(duì)專業(yè)級(jí)的GPU是1200萬套，看到我們這個(gè)數(shù)字是1200萬套，而所有其他的競(jìng)爭(zhēng)對(duì)手在這個(gè)專業(yè)領(lǐng)域的SGI，所有加起來的整個(gè)出貨量都不達(dá)不到我們這個(gè)數(shù)字。我們總的研發(fā)費(fèi)用每年是 10億美元，這里不僅僅指Quadro產(chǎn)品，其實(shí)也包括其他的GPU產(chǎn)品，還包括媒體、通信、處理器等等，所有加在一起是10億美元的研發(fā)費(fèi)用。正是由于我們這種研究的能力，我們的投入，我們的支持，我們確信我們公司在相關(guān)的工作站的處理器是最優(yōu)秀的。再看一下我們的專業(yè)團(tuán)隊(duì)，專門進(jìn)行專業(yè)領(lǐng)域的解決方案開發(fā)的工程人員有200名，包括在美國東西海岸，包括在德國、印度，可以說我們這些工程是地理方面區(qū)域分配跨了所有時(shí)區(qū)，一旦有問題在這里沒有解決，可能很快就傳到另外一個(gè)地方解決。我們這個(gè)產(chǎn)品實(shí)際上有垂直市場(chǎng)非常大的市場(chǎng)份額，而且接下來我會(huì)向大家介紹，我們?cè)谶@個(gè)市場(chǎng)上做的深度有多深，我們之所以現(xiàn)在在這個(gè)市場(chǎng)有80—85%的市場(chǎng)份額，要具體看地域，可能有略微的差異，主要是因?yàn)槲覀兡軌蚪o最終的客戶，通過我們的產(chǎn)品提供真正的一整套，適合他們的解決方法，我們?nèi)绾文軌蛑揽蛻粲惺裁磫栴}，他們需要解決什么問題呢，我們就要和最終的用戶公司談，去了解他們的需求，這些客戶遍布航空行業(yè)、醫(yī)療行業(yè)、游戲等等，我待會(huì)兒再給大家介紹。

由于我們服務(wù)的客戶類型非常多樣，所以我們所提供的Quadro的產(chǎn)品平臺(tái)非常多樣化，這個(gè)和我們競(jìng)爭(zhēng)對(duì)手有一些不一樣，我們競(jìng)爭(zhēng)對(duì)手往往只有某一種類型，比如像桌面系統(tǒng)等等，我們實(shí)際上有筆記本電腦，用于臺(tái)式，用于工作站，還有單獨(dú)的Quadro Plex這個(gè)產(chǎn)品，圖形到了一定大的時(shí)候，往往需要的功耗是比較大的，把它放在一個(gè)里面可能不行，所以我們就出來了Quadro Plex的產(chǎn)品，用于這種需求，還可以用于刀片里面，惠普就用到我們一款Quadro產(chǎn)品，用在刀片里面，同時(shí)在不久之前我們還開始了有了服務(wù)器的環(huán)境，比如像遠(yuǎn)程的圖形等等。這些都是我們可以提供的不同的平臺(tái)的產(chǎn)品，具體的接下來會(huì)給大家介紹。

接下來這個(gè)問題是，為什么人們要選擇Quadro，為什么不能用GeForce呢？這個(gè)問題經(jīng)常人有提到，實(shí)際上GeForce用在對(duì)圖形要求并不算太高的應(yīng)用上，接下來我給大家舉一個(gè)例子，用AutoCAD這個(gè)軟件的例子，AutoCAD是大家比較常用的軟件，它的價(jià)錢并不是太高，大概4000美元左右，通過使用我們Quadro可以進(jìn)一步提升AutoCAD的性能。

AutoCAD2008版出來以后，已經(jīng)從2D轉(zhuǎn)向了3D，我們?cè)谒麄兂鰜碇?，也是?duì)我們Quadro Plex的進(jìn)行了相應(yīng)的調(diào)整，從而能夠更好的支持它運(yùn)用，而現(xiàn)在Autodesk、AutoCAD對(duì)硬件進(jìn)行認(rèn)證，以往他們并不這樣做，只所以要認(rèn)證，是因?yàn)?D的環(huán)境中發(fā)生風(fēng)險(xiǎn)更高，所以現(xiàn)在對(duì)硬件進(jìn)行認(rèn)證，當(dāng)然Quadro是經(jīng)過認(rèn)證的。相比較GeForce而言，Quadro有一個(gè)大的特點(diǎn)就是它的設(shè)計(jì)，它的生產(chǎn)完全都是由我自己進(jìn)行的，而GeForce只是我們自己設(shè)計(jì)出來一個(gè)所謂的參考設(shè)計(jì)，把這個(gè)交給我們的合作伙伴，由他們根據(jù)他們的最終產(chǎn)品的要求，進(jìn)行相應(yīng)的調(diào)整，比如說具體的規(guī)格，相應(yīng)的環(huán)境、風(fēng)扇、冷卻系統(tǒng)怎么做，都有他們自己不同的做法。他們對(duì)自己的最終產(chǎn)品負(fù)責(zé)，而我們對(duì)他們進(jìn)行某些調(diào)整并不清楚。而在Quadro這個(gè)產(chǎn)品并不是這樣，完全由我們自己進(jìn)行管理，所以從性能價(jià)格比這個(gè)角度來說，可能差異并不大，但是從穩(wěn)定性，從受到認(rèn)證的情況來看，Quadro還是比GeForce要強(qiáng)很多。

大家看Autodesk的網(wǎng)站，大家可以看到它實(shí)際上對(duì)系統(tǒng)的要求增加了，原來都屬于標(biāo)準(zhǔn)，現(xiàn)在隨著64位3D出來，實(shí)際上規(guī)格增加了，要求也增加了，而且開始做認(rèn)證了。如果說你去用這個(gè)軟件的話，實(shí)際上它里面時(shí)候會(huì)對(duì)這個(gè)系統(tǒng)的環(huán)境進(jìn)行檢測(cè)，里面有一個(gè)叫性能調(diào)諧器，就會(huì)出來說這個(gè)環(huán)境是不是正常，上面的提示說的就是，現(xiàn)在的3D圖形環(huán)境是正常的。如果說你用的是一個(gè)未經(jīng)認(rèn)證的設(shè)備就會(huì)出來一個(gè)警告，會(huì)告訴你這個(gè)可以用，但是這個(gè)是未經(jīng)認(rèn)證的產(chǎn)品，這樣你可以用它，但是到底穩(wěn)定性和性能會(huì)是怎么樣，是不能保證的，而且出了問題是沒有辦法幫助你解決的。

大家如果看一下GeForce和Quadro價(jià)格在相同類似價(jià)位上，性能比較就可以看一下這張圖，這是一個(gè)雜志對(duì)AutoCAD的基本測(cè)試，左邊是GeForce，右邊的綠色點(diǎn)是Quadro，在不同的價(jià)格點(diǎn)上，Quadro的性能比GeForce高不少，也就是說很多人們會(huì)說Quadro太貴了，所以我們不用它，實(shí)際上用Quadro實(shí)際上不需要用那么高端的產(chǎn)品，可以往下降一降，在類似的價(jià)格上可以獲得更好的性能，并且是更穩(wěn)定的效果。這張總計(jì)了一下我剛才講的東西。

現(xiàn)在我們來看一下架構(gòu)，架構(gòu)這塊兒大約在8個(gè)月之前，我們做出了一個(gè)改變，就是隨著G80這個(gè)產(chǎn)品的推出，我們公司在也是最先推出所謂統(tǒng)一架構(gòu)的，我不知道大家誰知道統(tǒng)一架構(gòu)這個(gè)概念？對(duì)于統(tǒng)一架構(gòu)來說，現(xiàn)在如果你要用OpenGL，DirectX10，并且用Shader Model4.0，就必須要有統(tǒng)一架構(gòu)，否則就沒有辦法進(jìn)行運(yùn)行。為什么？我們先看一下過去20年當(dāng)中，到底是一個(gè)什么樣的情況？首先我們知道這是GPU的工作流程，首先是負(fù)責(zé)幾何這塊兒，有負(fù)責(zé)像素這塊兒，在幾何這塊兒，應(yīng)該由8個(gè)管線，在像素這塊兒有24個(gè)管線，幾何這塊兒處理三角形、點(diǎn)、多邊形等等，像素這塊兒主要是進(jìn)行紋理、渲染、光線等等這些東西，這些會(huì)進(jìn)行混合，要進(jìn)行抗鋸齒的處理等等。這些數(shù)據(jù)再放到幀緩存當(dāng)中，再顯示到屏幕上，這在過去20年當(dāng)中，圖形處理的程序。大家好象聽上去有點(diǎn)兒暈的感覺，但是大家不用擔(dān)心，大家不用去設(shè)計(jì)GPU。

老的管線架構(gòu)有什么不好呢？老的架構(gòu)處理幾何這塊兒的管線和處理紋理這塊兒的管線是分開的，就是它只能做這個(gè)，或者只能做那個(gè)，我們看第一張圖的形狀，它負(fù)責(zé)幾何的管線處理幾何就非常繁忙，處理像素的下面沒有幾何形狀，但是有光線效果，還有紋理，差異非常大，所以在處理這張圖，就使得上面的負(fù)責(zé)幾何的這方面的管線沒有什么事情干，而負(fù)責(zé)像素的處理，紋理的管線就會(huì)非常繁忙。

再看一下這張圖，我們之前看到的是非統(tǒng)一的架構(gòu)，也就是管線要么只能做這個(gè)，要么只能做那個(gè)，這上面是一個(gè)統(tǒng)一的架構(gòu)，這個(gè)圖看上去非常復(fù)雜，但是基本上面每一個(gè)綠點(diǎn)都代表一個(gè)管線，最大的是128個(gè)，既可以進(jìn)行像素的處理也可以進(jìn)行幾何的處理，不像以前只能做這個(gè)或者那個(gè)，以前是8個(gè)幾何的管線，加上24個(gè)像素的管線是32個(gè)，現(xiàn)在我們?cè)谶@上面最大的可以有128個(gè)管線。（大家隨時(shí)都可以提出問題來）

在統(tǒng)一架構(gòu)之下，跟以前就不一樣了，以后在統(tǒng)一架構(gòu)之下，如果是非常多的幾何的圖，所有線程處理器都可以進(jìn)行幾何的處理，不像以前有一些只能用來進(jìn)行像素的處理。下面這張圖是在紋理光線這塊兒，所以所有的線程處理器都可以進(jìn)行相應(yīng)的對(duì)光線和紋理的處理，其他的幾何處理只是其中很少的一部分。

在Quadro下面，我們也是針對(duì)不同的市場(chǎng)細(xì)分，在Quadro NVS這塊兒，主要針對(duì)2D的市場(chǎng)，還有金融業(yè)、呼叫中心等等，這個(gè)是用的比較多的在Quadro FX往往用于數(shù)字應(yīng)用，創(chuàng)新用的比較多，另外一塊兒是比較專門行業(yè)的應(yīng)用，比如說SDI，在廣播行業(yè)的應(yīng)用，還有應(yīng)用到大的屏幕強(qiáng)上面的，就需要用到我們同步幀鎖定交換鎖定的技術(shù)，像你們看到在右下角這個(gè)Quadro G-Sync，在非常高的性能下放可以使用Quadro Plex這樣的產(chǎn)品。針對(duì)于每一種應(yīng)用，我們都有相應(yīng)的應(yīng)用軟件包，同時(shí)我們會(huì)把這些硬件和軟件提供給相應(yīng)的公司，讓他們進(jìn)行認(rèn)證，進(jìn)行測(cè)試，這就是為什么我們?cè)赒uadro這塊兒有非常多的合作伙伴。

這上面是我們幀鎖定和交換鎖定的技術(shù)，如果大家聽了上午的演講，可能已經(jīng)聽到過相關(guān)的東西這是用在非常大的投影的顯示屏幕上，同時(shí)也用在3D的模擬空間當(dāng)中，比如說用在產(chǎn)品的模擬還有一些產(chǎn)品的評(píng)估等等，比如在在投影屏幕應(yīng)用當(dāng)中，可以用相對(duì)簡單的做法，像有一個(gè)系統(tǒng)兩個(gè)投影機(jī)投到一個(gè)屏幕上面，現(xiàn)在很多用戶要求有更高的性能，所以會(huì)把這個(gè)分成4—6個(gè)接點(diǎn)，就需要主機(jī)和附屬機(jī)當(dāng)中實(shí)現(xiàn)比較好的同步，否則的話，整個(gè)的圖象就會(huì)亂套了，這就是為什么我們有幀鎖定和交換鎖定來保證主機(jī)和其他附屬的機(jī)器之前能夠?qū)崿F(xiàn)好的同步。
#p#page_title#e#
第5頁：NVIDIA媒體圓桌會(huì)——Walter演講（下）

舉個(gè)例子，這是空客車，在歐洲他們所做的大的3D的模擬空間，這里用到了32個(gè)投影機(jī)，有16個(gè)屏幕，每個(gè)屏幕都是立體的，也就是一個(gè)投影機(jī)是管你的左眼，一個(gè)是管右眼，在前后左右上下都有相應(yīng)的屏幕，它的大小和實(shí)際的大小是1：1比例，使得人在這里面可以用3D的模擬方式看到實(shí)際是一個(gè)什么樣的情形。在SGI公司不在市場(chǎng)上之后，我們公司是唯一一個(gè)能夠提供這種解決方案的公司了。

還有就是我們Quadro Plex這個(gè)產(chǎn)品。這里有一個(gè)例子，是比較新的索尼4K的投影機(jī)，一個(gè)投影機(jī)有4個(gè)輸入，在他們參考的配置當(dāng)中用的就是Quadro這個(gè)產(chǎn)品，因?yàn)樗鬅o縫，并且是一個(gè)工作站的解決方案，他們認(rèn)為用Quadro產(chǎn)品是最為適合的。我們還有遠(yuǎn)程的圖形的產(chǎn)品，比如像在服務(wù)器環(huán)節(jié)當(dāng)中的，在這個(gè)當(dāng)中包含有4個(gè)高端的GPU，每個(gè)有1.5GB的緩存，在這個(gè)當(dāng)中大家可以看到把風(fēng)扇都放在下端了，它們屬于非常吵的，在使用這樣一個(gè)產(chǎn)品的環(huán)境下，大家都不愿意放在身邊，它專門是用服務(wù)器的環(huán)節(jié)設(shè)置的。對(duì)很多公司來說，他們希望能夠在服務(wù)器的房間當(dāng)中把圖形的功能可以完成，出于安全考慮，可以在服務(wù)器當(dāng)中把這些事情做完，再通過傳輸，傳輸?shù)浆F(xiàn)實(shí)設(shè)備去，這是他們認(rèn)為以后希望實(shí)現(xiàn)的，而我們現(xiàn)在正在開始往這個(gè)方向努力。還有一個(gè)服務(wù)器的應(yīng)用就是在金融類領(lǐng)域，他們不是出于安全的考慮，而是出于空間的考慮，比如說一個(gè)交易員，前面要擺6臺(tái)、8臺(tái)、10幾臺(tái)的顯示屏幕，他不希望放更多的電腦，而是希望使用服務(wù)器的解決方案，這也是介紹在空間當(dāng)中產(chǎn)生一些熱或者其他相關(guān)的污染。我們QuadroNVS這個(gè)產(chǎn)品，很多是為金融行業(yè)設(shè)計(jì)的，它們集中在工作站之內(nèi)，有相應(yīng)的軟件幫助他們進(jìn)行多個(gè)顯示器的管理等等，還有很多金融企業(yè)所需要的功能都可以通過我們的軟件來進(jìn)行實(shí)行。

大家看到的這些產(chǎn)品都是使用統(tǒng)一架構(gòu)，而我們最新推出就是FX3700，還有512兆的幀緩存，它的性能也會(huì)非常高，這個(gè)產(chǎn)品比較前面的產(chǎn)品它的性能提高是什么樣的情況呢？這張圖是我們新一代產(chǎn)品和此前產(chǎn)品之間的性能比較，藍(lán)色柱是我們新一代產(chǎn)品，黃色是前一代的產(chǎn)品，370是新一代，350是之前那一代，570是新一代，560是之前一代，這樣依此類推，可以看到在不同的高低端的產(chǎn)品上，新一代的產(chǎn)品性能相比較前一代都有比較大的提升，而且新一代低端一些的產(chǎn)品甚至超過了前一代比它高一級(jí)的產(chǎn)品。大家可以看到，我們最新推出的中高端的產(chǎn)品，F(xiàn)X3700，它和FX4600性能已經(jīng)沒有什么太多的差別了，至少從這個(gè)評(píng)測(cè)上面來說是這樣，它們之間的價(jià)格還有一定的差距，但是在這里所做的測(cè)試并沒有太多的考慮到，比如像幀緩存所帶來的影響，比如說你要處理很多紋理，有大量的數(shù)據(jù)的情況下，實(shí)際上幀緩存的大小對(duì)你的結(jié)構(gòu)還有比較大的影響，因?yàn)?700、4600、5600它們各自的幀緩存都不一樣，（一個(gè)是5、6兆，一個(gè)是8.5兆），看它們最終運(yùn)行什么的軟件，可能最終出來的結(jié)果還是有一定的差異。除此以外，在我們一個(gè)產(chǎn)品推出在市場(chǎng)存在的生命周期當(dāng)中，我們往往會(huì)進(jìn)行4—6次驅(qū)動(dòng)的改進(jìn)，而且我們這個(gè)驅(qū)動(dòng)是所謂統(tǒng)一的驅(qū)動(dòng)，我們所出來新的驅(qū)動(dòng)可以用在以前的產(chǎn)品上面，所以往往我們每過兩到三個(gè)月普遍就會(huì)對(duì)驅(qū)動(dòng)進(jìn)行一些更新，一般來說根據(jù)我們的歷史經(jīng)驗(yàn)，在一個(gè)產(chǎn)品從推出到撤出市場(chǎng)這段時(shí)間之內(nèi)，它的性能由于驅(qū)動(dòng)的改進(jìn)會(huì)有30—50%的提高，所以大家從這張圖上所看到的性能的表現(xiàn)還不是最后能夠達(dá)到的最高的狀況。

同時(shí)，我們新推出的產(chǎn)品，它在功耗上面也有所降低，像3700這款，功耗大概在78瓦左右，而之前這一代是在150瓦左右，性能優(yōu)60%的提高，功耗大概下降了一半左右，總的來說我們這些新的產(chǎn)品每瓦效能都有比較大的提升，在上面所列出的產(chǎn)品當(dāng)中，都已經(jīng)經(jīng)過了能源之星的評(píng)定。我們這些產(chǎn)品從FX370—FX3700都用PCI-E2.0，意味著我們總線帶寬已經(jīng)提高了。當(dāng)然坦白來說，大部分的應(yīng)用并不能用到這些帶寬，只能在很高端的應(yīng)用上使用這些帶寬。

與此同時(shí)，我們還在驅(qū)動(dòng)環(huán)境當(dāng)中不斷提高我們的產(chǎn)品用戶友好性，比如我們有一個(gè)叫ACE（程序配置引擎），為什么要有這個(gè)呢？我們知道對(duì)專業(yè)用戶來說，他們往往同時(shí)使用多個(gè)軟件，比如在桌面上同時(shí)運(yùn)行幾個(gè)，AutoCAD、Autodesk等等，同時(shí)打開，往往在以前他們需要針對(duì)于每一個(gè)，比如說利用這個(gè)應(yīng)用的時(shí)候，需要對(duì)于驅(qū)動(dòng)進(jìn)行相應(yīng)的設(shè)置，以實(shí)現(xiàn)最優(yōu)的性能，再用另外一個(gè)再重新設(shè)置一遍，這樣很麻煩?，F(xiàn)在我們有了這個(gè)ACE，就會(huì)自動(dòng)發(fā)現(xiàn)他在用什么，比如說你點(diǎn)開了新的軟件，新的程序，它就會(huì)發(fā)現(xiàn)你已經(jīng)用這個(gè)東西了，它就會(huì)進(jìn)行相應(yīng)的驅(qū)動(dòng)配置的調(diào)整，使得你可以在用這個(gè)程序的時(shí)候?qū)崿F(xiàn)最優(yōu)的性能，這個(gè)是我們最近才剛剛推出的，現(xiàn)在是用在Vista和XP上面。這是我們剛剛所推出的比較新的產(chǎn)品，是一周之前才推出的，我就不具體講產(chǎn)品具體的規(guī)格，如果大家有興趣可以聯(lián)系我們?cè)谥袊耐?，因?yàn)橐灿型略谶@邊，可以想他們要一些樣品等等，可以進(jìn)行一些檢測(cè)等等。

現(xiàn)在我們看一下，在垂直市場(chǎng)上面所做的工作，對(duì)于競(jìng)爭(zhēng)對(duì)手來說，他們對(duì)于垂直市場(chǎng)的定義，比如說制造業(yè)，實(shí)際上對(duì)我們來說，制造業(yè)并不是一個(gè)真正的簡單的垂直市場(chǎng)，比如像在制造業(yè)當(dāng)中就可以分成汽車、航空、造船等等。而在僅僅在汽車這個(gè)行業(yè)，都可以分成非常多的步驟，而且是非常復(fù)雜的。比如說首先是造型，在造型這塊兒就要畫出車的圖等等，你想讓它是什么樣的形狀，通過造型就進(jìn)入到設(shè)計(jì)階段，比如說你車身和表面怎么做，儀表盤，相應(yīng)的電子設(shè)備，還有動(dòng)力總成，包括你的引擎、發(fā)動(dòng)機(jī)、輪子應(yīng)該怎么樣，還有軸等等到底怎么樣設(shè)計(jì)。在設(shè)計(jì)之后還要進(jìn)行數(shù)字的模擬，就是上面的DMU，就是數(shù)字的模擬，還要考慮到駕駛的模擬，還有碰撞模擬，還有空氣動(dòng)力學(xué)方面的考慮。同時(shí)，在這個(gè)之后還需要進(jìn)入生產(chǎn)過程，就要進(jìn)行模具的制造，這個(gè)過程當(dāng)中也會(huì)用到可視化的東西，同時(shí)在工廠的設(shè)計(jì)上也希望是最為合理的，所以也需要首先要有一個(gè)數(shù)字工廠，進(jìn)行數(shù)字模擬，需要最大的合理性，這些過程當(dāng)中會(huì)生成很多3D數(shù)據(jù)，也可以應(yīng)用到市場(chǎng)營銷當(dāng)中。

舉個(gè)例子來說，像奧迪2.8這個(gè)車，在相應(yīng)的資料片上市之前，實(shí)際上并沒有一輛真實(shí)的車存在，所有的資料片當(dāng)中所用的東西都是利用3D制作出來的。這些3D數(shù)據(jù)化可以用做很多的用途，像保時(shí)捷有了這些3D數(shù)據(jù)之后，應(yīng)用到他們的培訓(xùn)當(dāng)中，比如說修理的培訓(xùn)，還有在網(wǎng)絡(luò)上讓這些用戶可以自己來進(jìn)行車輛的配置，通過使用3D數(shù)據(jù)，我們不久之前也收購了一個(gè)公司，這個(gè)公司也做很多相關(guān)的產(chǎn)品的開發(fā)，比如說在網(wǎng)絡(luò)上如何進(jìn)行實(shí)時(shí)的車載的配置等等，這都是他們的專長，同時(shí)也可以把這種技術(shù)用到經(jīng)銷商的終端，比如像通用汽車歐寶這個(gè)品牌，他們?cè)跉W洲已經(jīng)是部署了600臺(tái)這樣的終端，而且通過使用這樣的終端，每一個(gè)經(jīng)銷商都可以把他們的銷售增加30%。

現(xiàn)在我們可以看到，在整個(gè)汽車的設(shè)計(jì)、生產(chǎn)、銷售過程當(dāng)中，在很多的步驟上都可以用到我們這個(gè)產(chǎn)品，比如說像前面在演講當(dāng)中大家也看到了，在車身內(nèi)部現(xiàn)在一些GPU產(chǎn)品的使用，比如在顯示屏儀表盤，有駕駛員的支持系統(tǒng)等等，這些都可以用這個(gè)技術(shù)，而且現(xiàn)在很多的領(lǐng)域有CUDA和Tesla的產(chǎn)品，在模具方面我們希望使用通用的GPU，像模具制作過程當(dāng)中，會(huì)有一些塑料跟一些金屬，它們之間要脫開需要有一個(gè)比較巧妙的角度，一個(gè)什么樣的角度可以做的最好，這些都可以通過GPU的使用進(jìn)行相應(yīng)的模擬，從而實(shí)現(xiàn)最佳的模具制作，在這方面我們都在進(jìn)行工作。

大家可以看到這些是我們?cè)谥袊獾暮献骰锇楹涂蛻?，里面有美國、歐洲、日本、韓國，Google也是我們的客戶，比如像Google Earth，我們跟大眾進(jìn)行一個(gè)導(dǎo)航系統(tǒng)的研發(fā)，就會(huì)把數(shù)據(jù)從Google Earth拿過來，車?yán)锏鸟{駛員就可以讀到這些數(shù)據(jù)。Google也用到我們的服務(wù)器相應(yīng)環(huán)境的產(chǎn)品，比如在服務(wù)器當(dāng)用到了媒體通信處理器，在美國的Google在他們的平臺(tái)之上就有100萬個(gè)服務(wù)器接點(diǎn)。當(dāng)然，也可以看到我們的客戶遍布非常多的行業(yè)，比如在汽車行業(yè)，大家看到了很多汽車公司，還有醫(yī)療設(shè)備，包括通用電器，還有飛利浦、西門子等等，還有廣播電視臺(tái)等等，還有像電子產(chǎn)品，很多這些公司大家都非常熟悉，都是我們的客戶。在中國我們時(shí)間非常短，在Quadro這塊兒僅僅只有一年半的時(shí)間，但是我們也非常高興，中國的公司也非常愿意使用我們的產(chǎn)品。從這一頁上可以看到使用我們相關(guān)產(chǎn)品的公司的名字，寶鋼、福田汽車、通用、大眾、一汽等等，當(dāng)然也有原因是因?yàn)樗麄兒芏喽己蛧獾能噺S進(jìn)行合資，像豐田、大眾、奧迪等等，所以我們進(jìn)入的途徑相對(duì)來說也比較容易。

這上面大家可以看到更多，比如說數(shù)字內(nèi)容制作，還有游戲行業(yè)，我們?cè)趪鴥?nèi)的一些客戶，我也認(rèn)識(shí)客戶當(dāng)中很多的人，我們的銷售團(tuán)隊(duì)在中國也有很多的相關(guān)人員，我們也會(huì)到世界各地去和這些客戶談，去了解他們存在什么樣的問題，我們看是不是可以通過我們軟件的合作伙伴幫助他們解決相應(yīng)的問題，當(dāng)然通過利用我們的產(chǎn)品。

我已經(jīng)講了很長時(shí)間，聽了這么多，大家都覺得自己可以去設(shè)計(jì)圖形卡了，不知道大家現(xiàn)在有沒有什么問題？非常愿意回答大家的問題。

記者：剛才說到Quadro是通過動(dòng)態(tài)分配統(tǒng)一渲染，兩個(gè)單元，渲染單元和像素單元，我想知道是怎樣進(jìn)行的，是通過CUDA嗎？協(xié)調(diào)動(dòng)態(tài)統(tǒng)一是如何進(jìn)行的？

Walter：主要通過GPU當(dāng)中的驅(qū)動(dòng)來進(jìn)行的，到底哪些是幾何，哪些是像素部分，比如說這個(gè)數(shù)據(jù)進(jìn)來，我們這個(gè)軟件就會(huì)自動(dòng)判斷，到底是屬于處理三角形、幾何這塊兒，還是處理像素紋理這塊兒，對(duì)每一幀進(jìn)行測(cè)試，看哪些屬于幾何，哪些屬于像素這塊兒，總的來說由驅(qū)動(dòng)進(jìn)行分配，這和CUDA不一樣，CUDA是針對(duì)于每一個(gè)處理器，在CUDA當(dāng)中是通過驅(qū)動(dòng)來進(jìn)行的。

記者：有沒有與奧運(yùn)會(huì)相關(guān)的客戶以及新的應(yīng)用？

Walter：我們確實(shí)有，但是沒有得到客戶的許可，沒有辦法給予一些詳細(xì)的信息，比如我們跟（索貝）有很多的合作關(guān)系，他們是給很多廣播類的公司進(jìn)行軟件服務(wù)，特別是高清環(huán)境下，高清電視和3D內(nèi)容是做的比較多的領(lǐng)域，還有（水晶石）這個(gè)公司，也在這方面做很多的工作，也是我們的合作伙伴。

記者：是不是針對(duì)細(xì)分的垂直市場(chǎng)的功能，是不是已經(jīng)集成在里面了？

Walter：我覺得你說的沒錯(cuò)，比如說我們針對(duì)于廣播行業(yè)，我們有SDI的技術(shù)，SDI應(yīng)該叫串行數(shù)字接口，它可以幫助實(shí)現(xiàn)你的3D內(nèi)容和視頻融合在一起，如果做到這一點(diǎn)，就需要有一個(gè)SDI的輸入，往往以前的做法先在 GPU上面做，然后再到SDI板上面去，現(xiàn)在通過我們這個(gè)產(chǎn)品，就把GPU和SDI放在一起，可以實(shí)現(xiàn)實(shí)時(shí)動(dòng)畫等等，我們針對(duì)超大的屏幕墻有我們的同步鎖幀的技術(shù)，針對(duì)數(shù)字內(nèi)容創(chuàng)建OpenGL，我們有專門的驅(qū)動(dòng)，我們針對(duì)不同的市場(chǎng)有不同的驅(qū)動(dòng)，還有相應(yīng)的硬件?？匆幌挛覀冞@個(gè)產(chǎn)品系列，我們有8個(gè)標(biāo)準(zhǔn)產(chǎn)品，有5、6個(gè)針對(duì)不同行業(yè)的行業(yè)性的產(chǎn)品。大家可以看到下面這張畫是針對(duì)不同的，比如像SLI可以實(shí)現(xiàn)更高的性能，SDI是適用于廣播的行業(yè)，最后一個(gè)主要是在服務(wù)器環(huán)節(jié)當(dāng)中進(jìn)行使用的。還有一個(gè)MBS，這個(gè)產(chǎn)品主要是針對(duì)金融行業(yè)的還有呼叫中心，甚至包括9.11這種急救電話中心，因?yàn)樗麄冇泻芏嗥聊恍枰瑫r(shí)進(jìn)行管理。

記者：是不是這些是我們目前有的垂直專業(yè)市場(chǎng)的產(chǎn)品？

Walter：這是目前我們有的垂直專業(yè)市場(chǎng)的產(chǎn)品都在上面。這里面實(shí)際上有些是第三代產(chǎn)品，G-SyncII已經(jīng)是第三代產(chǎn)品，SDI是第二代產(chǎn)品，Plex是第二代產(chǎn)品，服務(wù)器是第一代產(chǎn)品。

記者：剛才說這個(gè)這個(gè)圖形服務(wù)器跟Tesla在應(yīng)用上有什么差異嗎？

Walter：這里有一些不同，首先Quadro Plex是支持OpenGL，而Tesla是不支持OpenGL的這是一個(gè)區(qū)別。第二，他們的內(nèi)存不一樣，因?yàn)閷?duì)于計(jì)算來說內(nèi)存非常重要，所以Tesla是一種特別的內(nèi)存，比如說對(duì)圖形來說，即便內(nèi)存犯一點(diǎn)兒錯(cuò)也不是那么大的問題，因?yàn)橐粋€(gè)像素每秒鐘要變50次，有一點(diǎn)兒錯(cuò)誤沒太大的問題，Tesla是用于計(jì)算，如果這里有錯(cuò)誤，都會(huì)影響后面的計(jì)算，所以后面的準(zhǔn)確性都非常重要。我們?cè)赥esla當(dāng)中有一個(gè)內(nèi)存控制器它會(huì)對(duì)對(duì)錯(cuò)進(jìn)行檢查，這和Quadro是不一樣的，而且本身它的內(nèi)存也是特殊的內(nèi)存也不一樣?？偟膩碚f，Quadro支持OpenGL，Tesla內(nèi)存更好一些，GeForce就便宜一點(diǎn)。Quadro其是從圖形的角度，Tesla是計(jì)算的角度。
#p#page_title#e#
第6頁：NVIDIA專業(yè)圖形解決方案高端論壇——Andy篇（上）

時(shí) 間：2008年1月17日
地點(diǎn)：北京麗思卡爾頓酒店酒店大宴會(huì)廳

Andy Keane：非常感謝大家今天來參加我們的論壇，這是我第一次到中國到北京，我覺得這個(gè)機(jī)會(huì)非常棒。今天我要跟大家介紹什么呢？是一種為大家設(shè)計(jì)推出的全新技術(shù)，幫大家解決軟件開發(fā)中的新問題。

CUDA技術(shù)是在去年推出，在Tesla之后推出，主要作用是幫助大家解決在你們的軟件、科學(xué)研究和工程當(dāng)中出現(xiàn)的新問題，所以我的演講會(huì)是兩部分，首先是CUDA技術(shù)，CUDA技術(shù)怎么出現(xiàn)的，大家如何使用這個(gè)技術(shù)，然后講另外一個(gè)產(chǎn)品線就是Tesla，這個(gè)產(chǎn)品線是面向工業(yè)應(yīng)用的，把GPU用于以前沒有用過的地方，比如說數(shù)據(jù)中心，人們?cè)谶M(jìn)行科學(xué)研究以及工程方面的應(yīng)用。

從這張圖上大家可以看到，可編程GPU隨時(shí)間發(fā)展的狀況，2002年我們推出了第一個(gè)可編程的GPU，在那個(gè)時(shí)候我們的變成單元只涉及了GPU的很小一塊兒——著色器，于是，在2002年，我們開始有了可編程的著色器。因?yàn)槲覀兊挠脩羰窍Ｍ羞@樣一種功能的推出，這樣的話就使得那些開發(fā)人員他們可以在圖形當(dāng)中做一些特殊的效果，就可以用到他們的創(chuàng)造性。因?yàn)楸緛鞧PU的功能是特定，而在2002年我們也希望能夠把GPU用于除了圖形以外的一些應(yīng)用，在2002年我們就推出了32位的浮點(diǎn)，這不僅僅是用于圖形的，把這個(gè)技術(shù)給了開發(fā)人員，而最終我們犯了一個(gè)錯(cuò)誤，就是在早期我們忘了一個(gè)重要的事情，這個(gè)重要的事情就是這是一個(gè)軟件工具，我們必須要能夠解決軟件開發(fā)人員的問題，不僅僅給他們一個(gè)硬件，一個(gè)新的處理器是不夠的，因?yàn)樵谀莻€(gè)時(shí)候GPU僅支持OpenGL圖形計(jì)算的，我們認(rèn)識(shí)到這個(gè)錯(cuò)誤重新開始，在2003年我們用了一些新的人，像計(jì)算機(jī)架構(gòu)人員，語言開發(fā)人員，讓他們和圖形以及工程人員一起開始了新的項(xiàng)目，最終就推出了我們的CUDA的技術(shù)。CUDA技術(shù)不僅僅是GPU的計(jì)算技術(shù)，同時(shí)也是編程環(huán)境，編程語言，它是第一個(gè)能夠把定型計(jì)算串行計(jì)算融入到一起的技術(shù)。開發(fā)人員解決了一個(gè)計(jì)算問題，他們用的C語言，C++，登記于網(wǎng)絡(luò)的語言或者是Java。他們?cè)诰幱?jì)算程序的時(shí)候，他們?cè)趺磥碜龅哪兀克麄兪亲鲆粋€(gè)C程序，然后就在CPU上進(jìn)行串行的計(jì)算，這個(gè)計(jì)算是按順序來進(jìn)行的。給大家看一個(gè)例子，要進(jìn)行并行計(jì)算的話，開發(fā)人員不得不加很多的軟件，就像多核或者是集群，你必須要用軟件的工具來解決并行計(jì)算問題，我們?cè)贑UDA當(dāng)中怎么做的呢？

在CUDA當(dāng)中，我們創(chuàng)建了一個(gè)環(huán)境，CUDA是可以統(tǒng)一并行和串行計(jì)算，CUDA是有三個(gè)組成部分，他是一個(gè)C語言編譯器，實(shí)際上用CPU的編譯工具開發(fā)出來的，這個(gè)方式IBM經(jīng)常使用，還有一個(gè)專門的計(jì)算驅(qū)動(dòng)程序，這不是一個(gè)圖形的驅(qū)動(dòng)，而往往速度更快，而且和圖形的驅(qū)動(dòng)不一樣，這樣的話就可以增加我們的計(jì)算能力，并且獨(dú)立圖形之外的，還有工具，還有標(biāo)準(zhǔn)的CPU類型的工具，包括像調(diào)試程序，分析器，我們還有很多樣本例子來說明如何用技術(shù)來解決一些相關(guān)的問題。我們還有很多的培訓(xùn)，還有手冊(cè)，還有教育工具，能夠讓開發(fā)人員來學(xué)習(xí)如何在GPU上進(jìn)行編程。我們看一下首先是計(jì)算的格式，我原來是做微處理器設(shè)計(jì)的，我們使用單核做一個(gè)設(shè)計(jì)，有一個(gè)指令在任何時(shí)間都能進(jìn)行一個(gè)指令的執(zhí)行。它是一種串行的方式，也就是一個(gè)一個(gè)指令來的。如果CPU是按照順序來的，而且是一小塊兒、一小塊兒來的，而CPU的工作方式首先要有很高的頻率，而且要很大的緩存，這樣的話就可以實(shí)現(xiàn)非常高速的串行計(jì)算。但是看一下GPU非常不一樣，GPU的設(shè)計(jì)可以解決并行的計(jì)算問題，圖形就是這樣，向每一幀大量的像素，像3D當(dāng)中更是以百萬進(jìn)行計(jì)算，這些都是并行實(shí)時(shí)的，所以大量的同時(shí)通過GPU，而且大量是并行，同時(shí)進(jìn)行計(jì)算。就是說把所有的數(shù)據(jù)一起拿進(jìn)來，可能是128個(gè)處理器同時(shí)進(jìn)行計(jì)算，所有都是同時(shí)進(jìn)行。CUDA就是這兩種類型之間的連接點(diǎn)，開發(fā)人員開發(fā)一個(gè)C程序，然后把CPU的代碼和GPU的代碼在原代碼當(dāng)中共存，而CUDA成為了串行計(jì)算和并行計(jì)算的連接，心里我們有一個(gè)編譯器在GPU上可以并行使用，CUDA可以延伸到CPU當(dāng)中，也就是說大家可以編CUDA的程序，并且可以在CPU上面進(jìn)行執(zhí)行，所以可以用并行的概念，并行是用于不同的設(shè)計(jì)當(dāng)中。

看一下到底在一個(gè)并行和串行當(dāng)中有哪些不同的特性呢？首先看一下GPU，它不是代替CPU，它們必須是攜手合作，因?yàn)镃PU有很多的技術(shù)，可以解決某些特定的問題，這些問題是非次序的，這些數(shù)據(jù)必須按照數(shù)據(jù)進(jìn)行。操作系統(tǒng)就是一個(gè)非常經(jīng)典的類型問題，是CPU非常善于處理的，很多不同的功能之間沒有關(guān)聯(lián)性，所有的數(shù)據(jù)之間沒有關(guān)聯(lián)性，所以要實(shí)現(xiàn)這種功能。還有數(shù)據(jù)庫，同時(shí)還有時(shí)間的壓縮，同時(shí)不斷地使用同樣的代碼，這種類型對(duì)CPU來說非常適用。GPU就不一樣了，有一些類型的問題，他們存在共同性，存在共同的主題。首先是海量數(shù)據(jù)的處理，像石油天然氣，他們從大陸上海上搜集到大量的數(shù)據(jù)，然后需要進(jìn)行處理怎么樣來進(jìn)行挖井，還有金融風(fēng)險(xiǎn)，股票市場(chǎng)，國內(nèi)還有其他國家的，所有這些信息數(shù)量非常大，需要進(jìn)行處理幫助人們進(jìn)行正確的決策。

還有另外一個(gè)例子就是醫(yī)療成像，在先進(jìn)的醫(yī)療設(shè)備當(dāng)中，比如像CT機(jī)或者是核磁共振，往往傳感器會(huì)出來大量的數(shù)據(jù)需要同時(shí)進(jìn)行處理，這對(duì)GPU來說非常適用。當(dāng)然GPU是需要和CPU來進(jìn)行合作，進(jìn)行數(shù)據(jù)的管理，對(duì)操作系統(tǒng)進(jìn)行管理等等。GPU上有三個(gè)不同的東西，首先有專用的計(jì)算，在GPU當(dāng)中，在進(jìn)行計(jì)算的時(shí)候是一種非常特殊的方式進(jìn)行，它不再做圖形，而是將自己作為一個(gè)計(jì)算單元模擬一個(gè)處理器就是來進(jìn)行計(jì)算。第二，GPU上的C環(huán)境，C是什么，任何開發(fā)人員理解C語言，現(xiàn)在就可以理解如何來對(duì)GPU進(jìn)行編程，而真正的挑戰(zhàn)很多開發(fā)人員面臨的就是如何來進(jìn)行一個(gè)并行的計(jì)算機(jī)的軟件，這個(gè)和其他的是一樣的，無論是多核還是集群，或者是GPU問題是一樣的，并不是一個(gè)單獨(dú)的GPU的問題。第三，出去在數(shù)據(jù)中心有一個(gè)問題，比如說你有一個(gè)高性能的工作站進(jìn)行工程設(shè)計(jì)等等，我們有一個(gè)專門的GPU產(chǎn)品針對(duì)這種環(huán)境。其中金融方面的計(jì)算，這是非常復(fù)雜的，結(jié)果非常不錯(cuò)。還有另外一個(gè)是天體物理學(xué)，就在今年波士頓就有一個(gè)專門的會(huì)議就是有關(guān)GPU在天體物理學(xué)當(dāng)中的使用，有一百多個(gè)科學(xué)家會(huì)來講，他們來自全世界，會(huì)講到新的類型的研究在GPU上面，以及他們?nèi)绾伟堰@個(gè)利用到天體物理學(xué)的研究當(dāng)中。在這樣的一些應(yīng)用當(dāng)中，還有一些設(shè)計(jì)應(yīng)用當(dāng)中，他們以前需要在大的計(jì)算機(jī)集群上，比如現(xiàn)在可以在工作站就可以解決了。

而且非常強(qiáng)調(diào)游戲的體驗(yàn)，游戲的性能，CUDA前面Walter也講到了，是用一些專業(yè)的應(yīng)用，某些特定的產(chǎn)品，一些性能。

第三個(gè)就是Tesla，為什么要用Tesla，是因?yàn)樵跀?shù)據(jù)中心沒有GPU，所以我們是專門引出了這種產(chǎn)品，針對(duì)特定類型的客戶。在這些GPU上，他們能做一些什么呢？大家可以看一下在GeForce上面，為什么要用GeForce上面的CUDA呢？除了游戲以外，很多游戲人員把CUDA納入游戲當(dāng)中，還有很多圖像，有很多數(shù)據(jù)是相機(jī)，我們可以獲得更快的圖像，更大的像素，更好的互動(dòng)，更平滑的畫面。用CUDA可以把所有這些好的這種圖像功能用出來，還有音頻、編碼、解碼、壓縮、安全性等等，所有這些功能都可以在GPU上并行處理。CUDA可以實(shí)現(xiàn)圖像可視化和音頻圖像同步。

通過CUDA可以讓這些更快，還有我們前面講了Tesla，它有哪些應(yīng)用，下面我會(huì)更具體的講。這是最新的應(yīng)用，在過去兩三個(gè)月當(dāng)中出現(xiàn)的，像實(shí)時(shí)的期權(quán)，還有分子動(dòng)力學(xué)，還有超聲影像，這是分子動(dòng)力學(xué)當(dāng)中的代碼，可以是嵌入到很多其他的不同的環(huán)境當(dāng)中，我們有很多的例子，在地震偏移等等。CUDA可以免費(fèi)提供，所以有很多的軟件不斷地出來我們也非常關(guān)注這些發(fā)展。
#p#page_title#e#
第7頁：NVIDIA專業(yè)圖形解決方案高端論壇——Andy篇（下）

現(xiàn)在看一下Acceleware的例子，這是開始一些公司在用圖形的API進(jìn)行計(jì)算，2006年他們推出一個(gè)產(chǎn)品是手機(jī)模擬的產(chǎn)品，很多手機(jī)上的天線用GPU進(jìn)行模擬，為了保證信號(hào)的完整性不受損害，還有安全，很多的廠商在設(shè)計(jì)手機(jī)的時(shí)候，會(huì)使用到GPU，這個(gè)技術(shù)也是嵌入的，而且也非?？欤a(chǎn)品推出的時(shí)候，我們是展示了一種差異，如果用僅僅用CPU，或者相比較CPU和GPU的差異，如果僅僅用CPU的話，CPU需要15小時(shí)，而GPU只需要15分鐘。我們跟媒體見面的時(shí)候，把這個(gè)給他們看了，基本說就在我講完之后，可能一個(gè)模型就已經(jīng)完成了，如果你用比較慢的技術(shù)，可能要等到明天。對(duì)工程師來說這個(gè)完全不一樣，因?yàn)橥ㄟ^快的技術(shù)，他們可以進(jìn)行非常好的互動(dòng)。

現(xiàn)在他們?cè)谧鲆恍┑卣鸱矫娴膽?yīng)用和研究也就是說他們希望用這個(gè)計(jì)算集群的算法來幫助一些油井公司來找到一些石油。在石油探測(cè)領(lǐng)域有一家公司叫HEADWAVE，他們也用了一些地理數(shù)據(jù)，你可以看到這漲圖，他們是關(guān)于石油的產(chǎn)品，看了一下這些圖就問，應(yīng)該在哪兒進(jìn)行鉆井呢？你要決定的時(shí)候，服務(wù)器要處理很多的地理信息，HEADWAVE他們把這些相關(guān)的數(shù)據(jù)收集起來之后建立一個(gè)數(shù)據(jù)庫，非常大，之后需要一個(gè)工作站通過GPU來進(jìn)行數(shù)據(jù)處理。

VMD/NAMD分子動(dòng)力學(xué)領(lǐng)域也是先鋒領(lǐng)域，去年我們的首席技術(shù)官，他說我在這個(gè)課上學(xué)了一點(diǎn)兒東西，之后可以用在視頻分子動(dòng)力學(xué)的設(shè)計(jì)中，包括分子，還有細(xì)胞，還有細(xì)菌動(dòng)力的分析。之后他發(fā)布了一款工具，在我們的網(wǎng)站上進(jìn)行發(fā)布，用了一個(gè)標(biāo)準(zhǔn)的工作站，3GPU的設(shè)計(jì)，基本上能夠達(dá)到非?？焖俣鹊倪@也是令人吃驚的研究。在美國如果用一家最先進(jìn)的研究機(jī)構(gòu)，也要花很長時(shí)間，很多的科學(xué)家來進(jìn)行研究才能得到這樣的結(jié)果。

再看一下Matlab，這個(gè)實(shí)驗(yàn)室都所有的工程師來說，他們?cè)谶@里使用CPU+GPU，通過使用這個(gè)，性能得到了17倍的提升，人們可以把電腦作為一個(gè)計(jì)算工具來使用。我們做了一個(gè)研究代碼，通過CUDA可以使用這個(gè)加速17倍，以前需要3天，現(xiàn)在只需要3個(gè)小時(shí)的時(shí)間，他們一周可以做兩次模擬，現(xiàn)在總的來說這個(gè)研究速度得到了很高的提升。

簡單介紹一下我們?cè)诮鹑陬I(lǐng)域中的應(yīng)用，金融領(lǐng)域是一個(gè)非常有趣的領(lǐng)域，尤其對(duì)高量數(shù)據(jù)的處理來說，對(duì)電腦的要求也非常高，我們?cè)诿绹梢栽谝幻腌姲衙绹械钠跈?quán)進(jìn)行處理，可以評(píng)估美國所有的股票期權(quán)，所以基本上是實(shí)時(shí)的可以處理這個(gè)結(jié)果。

再看一下Level3，他們也有很多的不同的期權(quán)不同的證券，他們也采用這個(gè)技術(shù)對(duì)七千進(jìn)行分析。這我們一個(gè)研究人員做的標(biāo)桿性的研究，它的性能可以比普通的電腦的速度要提高好幾百倍。所以總的來說，對(duì)GPU來說，在未來重要領(lǐng)域的應(yīng)用非常有前景。

這張圖是地理信息系統(tǒng)，或者是多重地理信息系統(tǒng)。在很多領(lǐng)域都可以應(yīng)用，比如說你想做城市規(guī)劃，建一些社區(qū)，房屋、道路的設(shè)計(jì)，這些的城市規(guī)劃人員可以用地理信息軟件或者技術(shù)來分析相關(guān)的人口信息和地理信息之后來決定是否在那里建一些醫(yī)院或者房屋等等。比如說應(yīng)該在哪個(gè)地方建立一些街道，還有我的電廠應(yīng)該在哪兒，這個(gè)軟件可以制作出一些地圖，疊加上人口信息，住房、人口、公路等等描述這個(gè)區(qū)域，這樣可以和地質(zhì)規(guī)劃人員，城市規(guī)劃人員進(jìn)行互動(dòng)，規(guī)劃人員可以使用GPU正確的設(shè)計(jì)出道路，可以打造更加高效的城市。

另外就是關(guān)于天體物理學(xué)，很久以前，有一系列的天體物理學(xué)家，他們覺得天體物理學(xué)能夠通過GPU來加速，在日本也使用了這個(gè)項(xiàng)目，他們使用了GPU之后效果非常不錯(cuò)。

再看一下曼德爾布羅特，這個(gè)很難做，它是一種非常簡單的應(yīng)用，我們?cè)诰W(wǎng)站上也是由學(xué)生開發(fā)的，他每天給我們打電話，發(fā)郵件，希望能夠得到一個(gè)板塊，之后我們給了他一塊兒，馬上就給我們做了曼德爾布羅特的模擬，所以現(xiàn)在已經(jīng)在我們的SDK上發(fā)布了，也就是對(duì)我們的工具包里對(duì)我們的開發(fā)人員進(jìn)行了正式公布。

給大家看一下演示，這是用筆記本電腦做的，這個(gè)用的G80的GPU，這是它的編碼，速度不是很慢，總而言之是手提電腦，負(fù)責(zé)大家對(duì)這個(gè)游戲比較感興趣，實(shí)際上也進(jìn)行了細(xì)節(jié)性的模擬，模擬水面的波紋。接下來一張，這是天體物理，實(shí)際上它是實(shí)時(shí)的模擬，也是用筆記本電腦做的，你可以看到在這上面，大概有35G浮點(diǎn)，但是整體的價(jià)錢不貴，僅僅900美元，所以任何物理學(xué)家都可以做比較有趣的模擬。另外有一點(diǎn)，它也是8800 GTX的基礎(chǔ)上設(shè)計(jì)的，它是在16GPU的體系上進(jìn)行操作的，實(shí)際上也可以在筆記本電腦上進(jìn)行運(yùn)行，因?yàn)樗容^穩(wěn)定。你可以看到這個(gè)就是GPU的好處。

這個(gè)比較有趣，但是給大家展示另外一個(gè)角度，基本是是從工業(yè)應(yīng)用的角度上來展示的，有一些領(lǐng)域大家在Walter 的發(fā)言中也看到了，就是視覺的領(lǐng)域，我們是怎么做的呢？我們首先有一個(gè)和電腦連接的攝像機(jī)之后進(jìn)行過濾，在CPU和GPU之間進(jìn)行過濾，點(diǎn)一下CPU，先點(diǎn)上面再點(diǎn)下面，你看數(shù)字比較少，但是你可以看到這個(gè)電腦上有10個(gè)飛行演示，所以對(duì)筆記本電腦來說，一個(gè)比較一般性的CPU加一個(gè)GPU的話就可以進(jìn)行8次的飛行演示?？梢钥吹竭@個(gè)圖像還是比較清晰的，我們?cè)倏醋詈笠稽c(diǎn)。這個(gè)圖像在CPU不太可能實(shí)現(xiàn)，基本上是通過GPU可以實(shí)現(xiàn)，這叫光流，也就是CPU來分析一下這個(gè)屏幕上的一些投射。我們?cè)贑PU上是不能夠做，比如說你可以看到一些色彩的損失，所有這些小的紅點(diǎn)，基本上都是小的三角，這些小三角能夠感知到屏幕上物品的運(yùn)動(dòng)，而這個(gè)矢量還有三角形的大小就是這個(gè)矢量，這在CPU上不能做，CPU只能做區(qū)域性的分析。所以，你可以看到對(duì)CPU電腦來說，你可以看到一塊兒一塊兒的東西，不能真正做細(xì)節(jié)的圖像描述。但是，這也是在筆記本電腦上做的。

『NVIDIA專業(yè)顯卡及解決方案展示區(qū)』

我們?cè)倏匆幌耇esla產(chǎn)品線，我們會(huì)繼續(xù)發(fā)展GPU，也會(huì)繼續(xù)朝筆記本電腦方向進(jìn)行進(jìn)一步的探索，但是在Tesla方面我們希望真正的有所探索。第一個(gè)就是工作站，我們有一些科學(xué)家和工程師他們有電腦，這樣我們可以桌面和桌邊型計(jì)算機(jī)上實(shí)現(xiàn)超級(jí)計(jì)算機(jī)的性能，我們給他們建立新的服務(wù)器，來滿足他們大規(guī)模計(jì)算的需求。另外，工作站的計(jì)算集群，也就是說在桌面計(jì)算機(jī)上可以建立一個(gè)標(biāo)準(zhǔn)的工作站。

接下來是關(guān)于服務(wù)器的，你可以看到這里有4個(gè)GPU，它的高度大概是1U的尺寸，可靠性比較高，同時(shí)對(duì)數(shù)據(jù)管理中心來說，之前的可能有4000多個(gè)服務(wù)器，有很多GPU，對(duì)管理人員來說怎么能夠看到哪個(gè)地方有些問題，比如說有一些風(fēng)扇散熱出了問題，那個(gè)地方怎么辦呢？GPU可以自我管理，自我處理，所以你可以看到密度比較高，目標(biāo)性能比較高，同時(shí)尺寸比較小，同時(shí)自我管理能力比較高。這是我們數(shù)據(jù)中心計(jì)算系統(tǒng)，對(duì)Tesla來說服務(wù)器是怎么做的呢？

你可以看到軟件能夠把軟件和CPU連接起來，這是有一個(gè)服務(wù)器，有兩個(gè)小的適配卡，放入服務(wù)器中，還有一些電纜，把GPU系統(tǒng)，目前有4個(gè)GPU，通過CPI的轉(zhuǎn)換器進(jìn)行連接，這樣可以把PCI，GPU和CPU連接起來。

這有4個(gè)8系列GPU，第二個(gè)是2個(gè)GPU，這是服務(wù)器解決方案是4個(gè)GPU，工作站就是兩個(gè)或者一個(gè)。剛才我簡單介紹了我們?cè)趺磻?yīng)用CUDA，怎么應(yīng)用計(jì)算的。今年你可以看到GPU在CUDA這方面會(huì)有進(jìn)一步的進(jìn)展，我們希望能夠建立一些新的平臺(tái)新的環(huán)境，希望能夠更好的提高計(jì)算速度。

謝謝大家。
#p#page_title#e#
第8頁：NVIDIA CUDA技術(shù)媒體介紹會(huì)——Andy篇（上）

時(shí) 間：2008年1月17日（11：00—12：00）
地點(diǎn)：北京麗思卡爾頓酒店

魏鳴：今天Andy在他的主題演講大部分介紹了CUDA的情況，在這里媒體有問題他來回答，他先介紹一下今天早上的內(nèi)容，再給大家重新總結(jié)一下。

Andy Keane：今天上午我總結(jié)一下，我們主要介紹了CUDA。另外，在07年我們主要推出了兩個(gè)最主要的技術(shù)，一個(gè)是CUDA，他是用新的編程環(huán)境，是對(duì)GPU編程，對(duì)一般的開發(fā)人員，通過使用CUDA能夠使用GPU來編程，以前開發(fā)使用CPU，C或者C++語言來編程，通過CUDA他們可以使用GPU來編程。

CUDA這個(gè)產(chǎn)品一大特點(diǎn)就是它能夠建立這樣比較好的軟件環(huán)境，一方面能夠使串行的處理成為可能，另一方面也能夠使并行的處理成為可能，這樣串行的CPU可以用順序處理一些數(shù)據(jù)，同時(shí)也把量比較大的數(shù)據(jù)分成不同的塊兒，GPU可以通過并行的方式進(jìn)行處理，總的來說CUDA建立一個(gè)比較好的軟件環(huán)境，同時(shí)使CPU和GPU并行數(shù)據(jù)處理成為可能。

另外，對(duì)CUDA來說比較有特色的一點(diǎn)就是它是通過把CPU并行起來一樣，讓CPU來處理不同塊兒的數(shù)據(jù)，也就是說通過軟件，CPU在處理的時(shí)候通過軟件來處理，也就是把不同的問題，或者不同的數(shù)據(jù)并行起來，通過管理不同的現(xiàn)在線程用軟件來處理問題，有的時(shí)候有困難，如果通過軟件管理和處理線程的話，為什么采用GPU呢？因?yàn)镚PU實(shí)際上是在建立就把管理的問題解決掉了，假設(shè)輸入一大堆程序或者信息，這時(shí)候GPU就會(huì)主動(dòng)的進(jìn)行計(jì)算，同時(shí)對(duì)這些線程進(jìn)行分析和計(jì)算，再反饋給你答案，這時(shí)候GPU只負(fù)責(zé)計(jì)算不負(fù)責(zé)管理，所以速度要快，而且更簡單一些。

『NVIDIAGPU計(jì)算事業(yè)部總經(jīng)理Andy Keane先生向參會(huì)媒體介紹專業(yè)顯卡優(yōu)勢(shì)及發(fā)展歷程』

另外，再說完最后一點(diǎn)大家就可以討論，我手上已經(jīng)有大家提出的一系列問題，討論問題的清單，這些問題問的非常好，都是關(guān)于軟件環(huán)境的，CUDA作為一個(gè)工具，目前僅僅處于開始的階段，這也是為什么我們現(xiàn)在用簡單的語言環(huán)境下利用CUDA，也就是C，這對(duì)很多的開發(fā)人員里說，他們就會(huì)更容易使用GPU，因?yàn)镃語言對(duì)他們來說非常容易，大家都會(huì)。這只是一類開發(fā)人員，在未來我們還會(huì)在新的工具，其他的高級(jí)語言上來使用CUDA，那時(shí)候我們可能會(huì)有一些新的設(shè)計(jì)，或者新類別的CUDA的應(yīng)用。

比如說一些高級(jí)語言現(xiàn)在就可以并行處理一些數(shù)據(jù)，我們就在CUDA的基礎(chǔ)上，因?yàn)镃UDA實(shí)際上是一種渠道，讓程序員能夠利用CUDA接觸使用GPU，在未來新的高級(jí)語言上，我們利用CUDA之后，整個(gè)的處理速度將會(huì)更快，比如說在C++語言上，我們可以把整個(gè)環(huán)境架構(gòu)在CUDA之上，或者整個(gè)驅(qū)動(dòng)之上。CUDA應(yīng)該在利用GPU的計(jì)算能力上，最底層的軟件環(huán)境，其他的語言就可以在這個(gè)基礎(chǔ)上進(jìn)行應(yīng)用了。

根據(jù)你們提的問題的清單，我也提大家感興趣得主題，大家想知道為我們要選擇CUDA，為什么要用CUDA，設(shè)計(jì)出CUDA的目標(biāo)是什么，應(yīng)用是什么，世界上在科學(xué)界、工業(yè)界大家都知道CUDA有比較好的應(yīng)用。大家比較感興趣的是對(duì)普通的消費(fèi)者來說，CUDA是不是有一定的未來可以使用呢？另外今天上午也做了一些小的演示。

舉個(gè)例子，就像筆記本電腦一樣，今天介紹關(guān)于天文物體學(xué)的設(shè)計(jì)和演示，實(shí)際上它能夠處理35G浮點(diǎn)的處理速度，就像手提電腦一樣，10—15年前尺寸相當(dāng)于一個(gè)大的房間，還是很笨拙的，現(xiàn)在可以處理視頻、音頻還有其他的應(yīng)用等等，所以潛力還是比較巨大的。CUDA也是一樣，我們僅僅推出一個(gè)初級(jí)的版本，或者剛推出的版本，在未來隨著性能不斷地提高，我們會(huì)推出下一個(gè)版本，再下一個(gè)版本，這樣不僅僅是程序員、科學(xué)家、工業(yè)人員他們可以使用CUDA進(jìn)行設(shè)計(jì)，包括普通的消費(fèi)者你們也可以利用CUDA來進(jìn)行自己的設(shè)計(jì)。超級(jí)計(jì)算，以前是在很大的電腦上運(yùn)行，現(xiàn)在由于有了這些先進(jìn)的GPU的技術(shù)和CUDA的技術(shù)，就可以在自己的電腦上，完成很高的科運(yùn)算。現(xiàn)在，大家有任何問題可以提出。

記者：我理解CUDA技術(shù)是NVIDIA動(dòng)態(tài)負(fù)載平衡技術(shù)，并且通過驅(qū)動(dòng)程序來實(shí)現(xiàn)的，可能是比較靈活，這種方式必須是用緩存技術(shù)來優(yōu)化推進(jìn)或者是同步計(jì)算？它依賴緩存技術(shù)，這種方式最終會(huì)不會(huì)以芯片內(nèi)制的方式整合到芯片當(dāng)中來實(shí)現(xiàn)呢？

Andy Keane：實(shí)際上對(duì)于很多圖形的站來說，復(fù)雜的因素都是在GPU里面的，圖形和計(jì)算基本的應(yīng)用是一樣的，在GPU里面有一些核心的應(yīng)用，或者說核心的程序，通過驅(qū)動(dòng)連接到CPU，基本上通過一個(gè)通道來平衡CPU和GPU，這個(gè)所謂通道就是我們所謂的芯片和芯片組，比如說你可以把一些軟件，包括一些應(yīng)用程序，包括驅(qū)動(dòng)，也就是CPU的軟件連接到GPU的內(nèi)核上，通過通道。但是總的來說，未來不會(huì)有太大的變化，不會(huì)出現(xiàn)芯片內(nèi)制的狀況，還會(huì)保持現(xiàn)狀。

記者：第一，關(guān)于GPU，咱們新的工具跟CPU和GPU的聯(lián)系非常緊密，我們?cè)贑PU這方面得到的支持有多大？比如說得到AMD和Intel的支持有多大？第二，我們有一個(gè)相關(guān)的社區(qū)，這個(gè)社區(qū)里面我們相關(guān)的東西會(huì)不會(huì)用開源的模式推廣，另外會(huì)不會(huì)對(duì)進(jìn)入這個(gè)社區(qū)對(duì)開發(fā)人員有一個(gè)獎(jiǎng)勵(lì)的機(jī)制？

Andy Keane：簡單介紹一下GPU和CPU處理的數(shù)據(jù)是各不相同的，解決的問題也是不同的，對(duì)GPU來說它處理一些比較類似統(tǒng)一的數(shù)據(jù)，能夠平行一塊兒的形式批量處理，但是對(duì)CPU來說，它是一種順序的方式處理一些少量的但是各不相關(guān)，不同的數(shù)據(jù)。比如說在我們操作系統(tǒng)中，你們會(huì)經(jīng)常看到，我們的CPU來處理鍵盤，還有你們的文檔等各種不同的程序，這是非常小的。各不相關(guān)的，基本上是CPU來處理。在實(shí)際應(yīng)用中兩個(gè)內(nèi)容都包括了，有的需要并行的處理一些數(shù)據(jù)，有的需要串行的處理一些數(shù)據(jù)，所以就需要我們要找到一個(gè)平衡。比如說對(duì)于你的手提電腦來說，基本上很大程度上使用的是CPU的處理，比如說各方面。在圖像和MP3這方面使用GPU進(jìn)行處理。另外在油井開發(fā)、地理信息這些工業(yè)應(yīng)用中，并行處理的數(shù)據(jù)很多，因?yàn)樾畔⒘勘容^大，都是比較類似的，但是需要以順序處理的方式的數(shù)據(jù)比較少，所以在不同的行業(yè)不同的應(yīng)用中我們都會(huì)找到不同的平衡。

記者：AMD也購并了一個(gè)企業(yè)，會(huì)不會(huì)對(duì)CUDA技術(shù)進(jìn)行一些限制？會(huì)不會(huì)影響CUDA的應(yīng)用。第二，Intel始終想跟NVIDIA這塊兒有合作，如果在這方面你們推出來CUDA是想在高端這塊兒有一些影響，Intel會(huì)不會(huì)對(duì)你們有一些限制，如果不得到這兩個(gè)公司的支持，CUDA在跟CPU的接觸中會(huì)有一些脫節(jié)，這樣的話GPU的能力就很難發(fā)揮出來，或者說即使GPU的能力發(fā)揮出來了，CPU也很難。

Andy Keane：實(shí)際上對(duì)于AMD來說，他們和CUDA在某種程度比較類似，他們的軟件環(huán)境比較類似，所以基本上娓娓道來我們預(yù)測(cè)他的代碼也好，軟件也好，將會(huì)非常類似于CUDA的一些代碼和軟件?，F(xiàn)在他只是把一些相關(guān)的部分拿出來放到他們的芯片中，因?yàn)槲覀兊男酒灰粯樱珻UDA和AMD是不一樣的，他們就把類似的因素拿出來放到芯片中。但是基本上我們是屬于一個(gè)俱樂部，因?yàn)槲覀兊募夹g(shù)也是一樣的，軟件也是一樣的，未來他們有所發(fā)展對(duì)我們并是一種威脅。

關(guān)于Intel，他們的軟件采用多核的CPU技術(shù)，但是由于他們多核的存在，他們的運(yùn)行問題太多了。為什么呢？因?yàn)槌绦騿T們總是要處理很多多核的運(yùn)算還有設(shè)計(jì)，處理多重的線程，你編的軟件要在不同的線程上運(yùn)行，而且能在2、4、6個(gè)不同的處理器之間靈活的轉(zhuǎn)換，這已經(jīng)是非常難的事情。所以，對(duì)Intel多核電腦來說可靠性比較低，作為媒體你們也經(jīng)常報(bào)道，多核技術(shù)總是問題比較多，已經(jīng)成為他們往前發(fā)展的一個(gè)障礙了。

我們有很多的挑戰(zhàn)需要去解決，一個(gè)好的軟件開發(fā)員利用多核來做的話，它的穩(wěn)定性，因?yàn)橐卸嗑€程來開發(fā)，穩(wěn)定性就會(huì)有問題，很多問題需要去解決。

另外也想強(qiáng)調(diào)一點(diǎn)，在這個(gè)軟件環(huán)境下，我們并不準(zhǔn)備代替或者替代軟件中的多核CPU，為什么？因?yàn)樵谖磥矶嗪说腃PU還在運(yùn)行系統(tǒng)中運(yùn)行，同時(shí)GPU只是負(fù)責(zé)處理那些非常大的，海量的而且需要快速處理的數(shù)據(jù)，它的功能主要是在不替代CPU的前提下，來主要負(fù)責(zé)處理大量的數(shù)據(jù)，而大量的線程仍然是存在CPU上?？偟膩碚f，CPU和GPU共存，在未來GPU處理大量的音頻、視頻還有圖像這樣一些數(shù)據(jù)，但是CPU還會(huì)處理一些串行的內(nèi)容。
#p#page_title#e#
第9頁：NVIDIA CUDA技術(shù)媒體介紹會(huì)——Andy篇（下）

魏鳴：我們說的CUDA這個(gè)東西是怎么樣更好的利用GPU的計(jì)算能力去開發(fā)新的應(yīng)用出來，這在以前人們基于CPU來開發(fā)應(yīng)用程序，但是GPU的能力沒有被很好的開發(fā)出來，我們推出CUDA就是為了更好的利用GPU的計(jì)算能力，所以我們說的CUDA這個(gè)技術(shù)和其他的公司所談到的利用CPU來進(jìn)行的這種編程是不同的范疇，解決的問題不一樣。就剛才說的CPU和GPU的運(yùn)行模式也不一樣，所以他們之間不是對(duì)立，是并存在一些解決不同的問題。

Andy Keane：CUDA作為一個(gè)軟件，CUDA是用C程序基礎(chǔ)上的一個(gè)軟件，他可以在不同的市場(chǎng)上應(yīng)用，比如說GeForce一些應(yīng)用市場(chǎng)等等，但是對(duì)工業(yè)或者高端的大量數(shù)據(jù)處理的領(lǐng)域來說，應(yīng)該是Tesla這個(gè)產(chǎn)品。我們有兩個(gè)競(jìng)爭(zhēng)對(duì)手，其中有一個(gè)是FPGA，這個(gè)時(shí)候大家就問這個(gè)問題，為什么我們會(huì)選擇CUDA而不選擇FPGA，對(duì)程序員來說他要選擇程序運(yùn)行的時(shí)間有多長，對(duì)FPGA來說，如果發(fā)生變化是要在芯片方面發(fā)生變化，所以它只能解決一些非常特殊的問題，在某些問題的解決上，F(xiàn)PGA的性能比較好，但是問題是可編程性比較差。

魏鳴：CUDA跟編程語言的區(qū)別，比如說金融業(yè)方面你要分析證券，如果用FPGA就要有變化要重新設(shè)計(jì)，用CUDA不需要重新設(shè)計(jì)，改變程序就可以了，這樣便于開發(fā)人員應(yīng)用，而且可編程性更強(qiáng)了，這是主要的區(qū)別。

記者：如果使用CUDA的話，這個(gè)程序員是不是要在開發(fā)習(xí)慣上有所改變？

Andy Keane：總的來說，CUDA解決的是并行的計(jì)算的一些問題，實(shí)際在CUDA出現(xiàn)之前有很多其他的技術(shù)，也出現(xiàn)并且目的是為了解決這些問題，這些問題是并行大量的數(shù)據(jù)處理，也是早就存在的，這也是為什么出現(xiàn)了多核處理器，出現(xiàn)了FPGA等等其他的技術(shù)。就像看一本書一樣，作為CPU會(huì)一頁一頁過這些書，再把相關(guān)的詞找出來。但是GPU就很簡單，把整個(gè)書分成好幾塊兒，同時(shí)并行處理這些內(nèi)容找到你的目標(biāo)?？偟膩碚f，這個(gè)問題的設(shè)計(jì)，這個(gè)思維，這個(gè)概念才是最主要的，編程也很重要，但是和設(shè)計(jì)相比不像設(shè)計(jì)那么重要，設(shè)計(jì)是核心的。所以，在程序上可以通過CUDA，可以通過多核或者FPGA來解決，但是對(duì)程序員來說需要在思維上有所改變，在程序操作上不用做太大改變。

魏鳴：軟件不需要做改變，只是在擴(kuò)充編程的時(shí)候要從硬性的角度考慮這個(gè)問題，這個(gè)才是最重要的。

記者：我有三個(gè)問題。第一，CUDA在圖形編程方面和現(xiàn)有的圖形開發(fā)環(huán)境，比如說OpenGL在做圖形編程的時(shí)候是否會(huì)有沖突？只能用其中一種。第二，使用CUDA這種應(yīng)用程序是不是只能在NVIDIA的硬件平臺(tái)上？如果是的話，我覺得未來可能出現(xiàn)多種GPU接口的標(biāo)準(zhǔn)，是否有一種解決方案解決多種應(yīng)用平臺(tái)之間的兼容性問題。第三，CUDA是否能夠在移動(dòng)開發(fā)環(huán)境中應(yīng)用？比如說在手機(jī)上，現(xiàn)在有沒有計(jì)劃與手機(jī)的操作系統(tǒng)開發(fā)商有這種合作計(jì)劃呢？

Andy Keane：在設(shè)計(jì)上，我們CUDA在圖像處理這方面已經(jīng)考慮了要通過API，OpenGL所設(shè)計(jì)的圖像能夠兼容或者設(shè)計(jì)接口，首先建一個(gè)像素緩沖目標(biāo)，后寫入API，整個(gè)過程還是比較容易實(shí)現(xiàn)。像之前的演示里面也是這樣一個(gè)概念，就是在圖形和CUDA之間，我們實(shí)際上找到一個(gè)平衡，天體物理學(xué)那個(gè)演示中大家能夠看到。因?yàn)橛械臅r(shí)候CUDA并不能處理所有圖的信息，而圖也不能處理CUDA所能夠處理的信息，因?yàn)镃UDA處理信息比較獨(dú)特，那些非結(jié)構(gòu)性的數(shù)據(jù)，包括字符和一般性的數(shù)據(jù)，對(duì)圖來說，處理的數(shù)據(jù)更加具體更加特定，所以我們?cè)谠O(shè)計(jì)上也考慮了不同的因素組合起來。

第二個(gè)問題，CUDA剛剛開始是我們公司的產(chǎn)品，我們也會(huì)基于我們公司的產(chǎn)品推廣這個(gè)技術(shù)，但是CUDA在計(jì)算領(lǐng)域里，只有開放式的架構(gòu)和技術(shù)才能夠有生命力，所以CUDA會(huì)慢慢的把它在CPU上運(yùn)行，或者在其他的GPU上面運(yùn)行，這肯定是以后的趨勢(shì)。但是，我們不會(huì)強(qiáng)調(diào)行業(yè)接受這個(gè)技術(shù)，而是有這樣一個(gè)平臺(tái)，這樣一個(gè)技術(shù)讓大家一塊兒來開發(fā)。將來有一個(gè)情況就是其他的人采用它，可能會(huì)有其他的標(biāo)準(zhǔn)出來，我們一塊兒互相結(jié)合在一起做，所以還會(huì)是行業(yè)性開放性的技術(shù)，發(fā)展方向應(yīng)該是這樣的。

第三個(gè)問題，CUDA對(duì)移動(dòng)設(shè)施來說是高中端的產(chǎn)品，但是它的體積比較小，對(duì)CUDA來說目前是嵌入GPU的技術(shù)，或者是什么也好，我想未來技術(shù)可能會(huì)用在手機(jī)上，但是可能要經(jīng)過幾代，直到技術(shù)允許它的尺寸可以縮小到一定的大小，另外需要的電源，還有各方面的需求可以滿足手機(jī)需要的時(shí)候，但是中間可能要經(jīng)過一段時(shí)間。

Andy Keane：應(yīng)用于計(jì)算機(jī)的計(jì)算技術(shù)，你最后看到在你手機(jī)上需要花幾年，因?yàn)槟阋獪p少功耗才能用，現(xiàn)在在高端的，GeForce 8系列可以用，慢慢會(huì)一步步的推進(jìn)。

記者：我們公司現(xiàn)在倡導(dǎo)通用GPU計(jì)算，我們有沒有在這方面有更多的實(shí)驗(yàn)運(yùn)行？是不是需要更多開發(fā)部來支持新的通用計(jì)算？

Andy Keane：我們首先定義一下什么叫做通用計(jì)算？通用計(jì)算基本上通過CG或者OpenGL，或者其他的圖形語言進(jìn)行圖形的計(jì)算問題，一般我們會(huì)把紋理作為一些資料來進(jìn)行輸入之后，把這些數(shù)據(jù)進(jìn)行分析，可能產(chǎn)出的就是紋理的顏色等等各種分析結(jié)果，CUDA主要采用C編譯器，我們也有自己的一些庫，但是總的來說是基于C語言的，是不是還會(huì)建立其他的庫開發(fā)新的功能？基本上在C編譯器上，不是真正有所謂的庫，基本上就是C編譯器上的開發(fā)。

記者：在Gelato里面是不是應(yīng)用了CUDA，如果不是的話，CUDA是不是開發(fā)了圖像方面的軟件？CUDA是不是用于開發(fā)游戲運(yùn)算中物理隱形方面的東西？

Andy Keane：在Gelato中沒有使用CUDA，其實(shí)Gelato開發(fā)之前就已經(jīng)存在開發(fā)好了，但是我們使用CUDA進(jìn)行開發(fā)，這方面我們的確也有一些活動(dòng)，但是具體是哪個(gè)產(chǎn)品我們不能告訴你，因?yàn)楫a(chǎn)品經(jīng)理不會(huì)同意我這么做，如果我要提前在他的產(chǎn)品出來之前就向你們宣布的話，他肯定不會(huì)高興的。實(shí)際上我們現(xiàn)在已經(jīng)有一個(gè)產(chǎn)品市場(chǎng)上可以看到，就是紋理壓縮的一個(gè)設(shè)施，或者說一個(gè)設(shè)備，主要是處理紋理還有圖像等等。主要是加強(qiáng)一些視覺上的效果，就這個(gè)渲染器我也不能做太多評(píng)論，但是總的來說它在渲染方面還是不錯(cuò)的。我們也做過一些試驗(yàn)，但是我覺得很多開發(fā)商他們覺得物理卡價(jià)值并不高，而且興趣也不是很大，實(shí)際上有兩種方法來解決這個(gè)問題。一個(gè)就是用你的多核，物理卡的問題可以用多核CPU來解決，比如說你電腦里有4個(gè)核，一個(gè)是操作系統(tǒng)，一個(gè)是游戲，還有兩個(gè)額外的核。另外有一部分的物理的特性可以通過GPU來解決，但是GPU實(shí)際上處理的是一些，比如說CPU適合游戲處理和游戲相關(guān)的深嵌程度比較深的物理特性，但是GPU處理的是形象，或者看起來怎么樣，或者說視覺效果等等。比如說在一款游戲里面，舉個(gè)簡單的例子，樹動(dòng)的時(shí)候使用的是GPU，因?yàn)樗鼘?shí)際上和打游戲沒什么關(guān)系，但是人跨過草叢的動(dòng)作就跟游戲的相關(guān)性更高，而且和AP的相關(guān)性更高，這個(gè)時(shí)候使用的就是CPU來進(jìn)行處理。

記者：第一，我發(fā)現(xiàn)有CUDA的GPU有128個(gè)內(nèi)核，就是說對(duì)一個(gè)程序員面對(duì)如此多的內(nèi)核開發(fā)的時(shí)候，他如何能夠知道他已經(jīng)充分利用了這128個(gè)內(nèi)核，也許他的程序?qū)懙牟缓?，沒有充分利用好，或者說他應(yīng)該再買一個(gè)新的GPU，而不是程序的問題。
第二，我發(fā)現(xiàn)對(duì)于CUDA并不是把一個(gè)C的代碼或者是它的程序直接翻譯成GPU的語言，而是中間通過PTS的編譯器。我就有一個(gè)問題，關(guān)于PTS編譯器，我們程序員是不是可以直接編輯PTS的代碼控制GPU，直接對(duì)硬件進(jìn)行操作，而不需要寫C語言。

安迪•凱恩：就程序員開發(fā)而言，實(shí)際上我們也準(zhǔn)備了一系列工具幫助程序員更好的利用資源進(jìn)行開發(fā)，比如說我們有4個(gè)調(diào)節(jié)器，它是（GTP）的調(diào)節(jié)器，你通過調(diào)節(jié)器可以分析是不是哪個(gè)地方出問題了，如果出問題你可以一步式的解決，這樣的調(diào)節(jié)器是CPU式的調(diào)節(jié)器。另外，我們也有一個(gè)分析器，這個(gè)分析器能夠幫助你分析你的編碼效率怎么樣，資源是不是完全利用了，或者在128個(gè)處理器中是不是都被利用了，另外我們會(huì)有一個(gè)Excel表格，上面列入不同的信息，在你編程序之前可以利用這個(gè)表格更好的利用這些資源，更好的進(jìn)行程序開發(fā)。對(duì)于GPU來說，實(shí)際上它的處理速度你們已經(jīng)知道了，比CPU要快得多，但是我們采用一個(gè)中間語言叫PTS，主要是為了保證背后基層的GPU快速運(yùn)行的時(shí)候，整個(gè)系統(tǒng)還是穩(wěn)定的，從C語言進(jìn)行開發(fā)之后轉(zhuǎn)換到PTS，這個(gè)過程也是相對(duì)來說更穩(wěn)定，因?yàn)镚PU處理速度非常快，我們需要找到這個(gè)中間語言能夠穩(wěn)定。對(duì)我們來說，我們建議程序員還要用C語言來開發(fā)，還是一個(gè)詞穩(wěn)定，用PTS來開發(fā)更大程度是一種工具和編譯器，讓你更好的接觸到一些數(shù)據(jù)。這實(shí)際上跟CPU也一樣，很少有人說真正的去編，基本上用一個(gè)編譯器來做，編譯器已經(jīng)很好了，它能夠保證這個(gè)系統(tǒng)的穩(wěn)定。

記者：我們有沒有開發(fā)更高級(jí)語言的計(jì)劃？

Andy Keane：我們本身不是軟件開發(fā)商，我們只是建立一個(gè)底層，讓更多的軟件開發(fā)商開展他們的東西。
#p#page_title#e#

第10頁：NVIDIA為HPC開發(fā)人員發(fā)布全新網(wǎng)絡(luò)社區(qū)

隨著NVIDIA的Tesla品牌旗下的GPU（圖形處理器）運(yùn)算產(chǎn)品和CUDA軟件開發(fā)工具的使用者越來越多，為了更好地履行對(duì)客戶的承諾，NVIDIA公司開設(shè)了一個(gè)專門為高性能計(jì)算（HPC）開發(fā)人員提供服務(wù)的資源社區(qū)——CUDAZone。

CUDA是世界上唯一針對(duì)GPU（圖形處理器）開發(fā)的C語言開發(fā)環(huán)境。自2007年2月發(fā)布以來，CUDA幫助工程師、科學(xué)家、地球物理學(xué)家等科研工作者實(shí)現(xiàn)了許多新的、工作必備的海量信息處理，并且將處理速度大幅提升到了相當(dāng)于之前45至400倍。

CUDAZone站點(diǎn)將會(huì)成為專業(yè)人士、學(xué)者以及所有對(duì)CUDA和Tesla有興趣的人們的全球性交流中心。站點(diǎn)功能涵蓋編程技術(shù)發(fā)布、客戶聚焦、項(xiàng)目張貼和方法交流的論壇、CUDA工具的下載、代碼實(shí)例、新聞事件等諸多內(nèi)容。

NVIDIA的GPU計(jì)算事業(yè)部總經(jīng)理安迪۰凱恩（Andy Keane）表示：“自HPC社區(qū)成立以來，我們通過社區(qū)了解到客戶對(duì)CUDA非常支持。每天都有客戶發(fā)電子郵件告訴我們，他們的工作流程運(yùn)行速度得到了難以想象的提升。CUDAZone將會(huì)成為這些成果的聚集點(diǎn)，并為我們的用戶提供一個(gè)集最新資訊、資源下載和數(shù)據(jù)更新于一體的平臺(tái)。”

欲了解更多信息以及下載CUDA SDK以及工具，請(qǐng)登錄www.nvidia.com/cuda。

Andy Keane—GPU計(jì)算事業(yè)部總經(jīng)理

Andy Keane先生于2006年加盟NVIDIA公司，出任NVIDIA公司全新的GPU計(jì)算事業(yè)部的總經(jīng)理，全面負(fù)責(zé)這一全新業(yè)務(wù)部門的組建，包括財(cái)務(wù)、銷售、市場(chǎng)運(yùn)作、產(chǎn)品規(guī)劃以及推廣等。

在加入NVIDIA之前，Andy Keane先生曾分別在Morphics及Ageia兩家公司的創(chuàng)業(yè)期任職市場(chǎng)副總裁，這兩家公司主要為電信以及消費(fèi)品行業(yè)開發(fā)并行計(jì)算技術(shù)。在此以前，Andy Keane先生曾為3dfx公司和QED公司的快速發(fā)展以及最后公開上市做出了卓越貢獻(xiàn)。其中，3dfx公司帶動(dòng)了消費(fèi)級(jí)3D圖形加速器的發(fā)展，而QED公司則是世界首批多核處理器供應(yīng)商之一。

不僅如此，Andy Keane先生在Xilinx公司早期進(jìn)行的可重配置計(jì)算以及FPGA系統(tǒng)的開發(fā)過程中，也發(fā)揮了重要作用。此外，Keane還曾任職于英特爾生產(chǎn)設(shè)計(jì)部門，從事容錯(cuò)并行計(jì)算技術(shù)的生產(chǎn)設(shè)計(jì)。

Andy Keane先生擁有伯克利商學(xué)院（Berkeley Business School）的MBA學(xué)位和倫斯勒理工學(xué)院（Rensselaer）的物理學(xué)學(xué)位。

Walter Mundt-Blum—專業(yè)解決方案事業(yè)部全球銷售副總裁

Walter Mundt-Blum先生1955年生于德國，1978年獲得電子工程碩士學(xué)位。在1978年至2000年間，Mundt-Blum先生任職于三菱電器歐洲公司，擔(dān)任歐洲外圍設(shè)備業(yè)務(wù)部門主管。

2000年至2002年，Mundt-Blum先生擔(dān)任艾爾莎（ELSA）公司專業(yè)圖形業(yè)務(wù)執(zhí)行副總裁。Mundt-Blum先生于2002年加盟NVIDIA公司，現(xiàn)今擔(dān)任NVIDIA公司專業(yè)解決方案事業(yè)部全球銷售副總裁。

關(guān)閉此頁

上一篇：NVISION 08 大會(huì)報(bào)道—NVIDIA開發(fā)團(tuán)隊(duì)專訪

下一篇：微軟官方DirectX 11演示文稿

一级毛片aaaaaa视频免费看|超人碰碰碰人人成碰人|一边吃奶一边扎下边爽了,亚洲欧美日韩中文高清一,真实破99年美女的处,欧美精品18videose×性欧美

NVIDIA副總Walter談專業(yè)卡技術(shù)及行業(yè)客戶應(yīng)用狀況

相關(guān)文章

工程技術(shù)(工科)專業(yè)工作站/服務(wù)器硬件配置選型

新聞排行榜

最新信息

應(yīng)用導(dǎo)航: