|
什么是GPU服務(wù)器?如何正確選擇GPU服務(wù)器?說到顯卡,估計(jì)90%以上的人都認(rèn)為這就是一個(gè)游戲工具。現(xiàn)在高性能的顯卡難道只是為游戲而生嗎?目前不少公司已經(jīng)認(rèn)識(shí)到GPU大規(guī)模并行計(jì)算帶來的優(yōu)勢,開始用強(qiáng)大的多GPU服務(wù)器進(jìn)行各種方向的研究,而這些研究除了能給公司帶來巨大收益外,其研究成果也開始應(yīng)用在我們的日常生活中。 什么是GPU服務(wù)器? GPU服務(wù)器是基于GPU的應(yīng)用于視頻編解碼、深度學(xué)習(xí)、科學(xué)計(jì)算等多種場景的快速、穩(wěn)定、彈性的計(jì)算服務(wù)。 GPU服務(wù)器有什么作用? GPU 加速計(jì)算可以提供非凡的應(yīng)用程序性能,能將應(yīng)用程序計(jì)算密集部分的工作負(fù)載轉(zhuǎn)移到 GPU,同時(shí)仍由 CPU 運(yùn)行其余程序代碼。從用戶的角度來看,應(yīng)用程序的運(yùn)行速度明顯加快. 理解 GPU 和 CPU 之間區(qū)別的一種簡單方式是比較它們?nèi)绾翁幚砣蝿?wù)。CPU 由專為順序串行處理而優(yōu)化的幾個(gè)核心組成,而 GPU 則擁有一個(gè)由數(shù)以千計(jì)的更小、更高效的核心(專為同時(shí)處理多重任務(wù)而設(shè)計(jì))組成的大規(guī)模并行計(jì)算架構(gòu)。 GPU服務(wù)器的主要應(yīng)用場景 海量計(jì)算處理 GPU 服務(wù)器超強(qiáng)的計(jì)算功能可應(yīng)用于海量數(shù)據(jù)處理方面的運(yùn)算,如搜索、大數(shù)據(jù)推薦、智能輸入法等: • 原本需要數(shù)天完成的數(shù)據(jù)量,采用 GPU 服務(wù)器在數(shù)小時(shí)內(nèi)即可完成運(yùn)算。 • 原本需要數(shù)十臺(tái) CPU 服務(wù)器共同運(yùn)算集群,采用單臺(tái) GPU 服務(wù)器可完成。 深度學(xué)習(xí)模型 GPU服務(wù)器可作為深度學(xué)習(xí)訓(xùn)練的平臺(tái): 1.GPU 服務(wù)器可直接加速計(jì)算服務(wù),亦可直接與外界連接通信。 2.GPU 服務(wù)器和云服務(wù)器搭配使用,云服務(wù)器為 GPU 云服務(wù)器提供計(jì)算平臺(tái)。 3.對(duì)象存儲(chǔ) COS 可以為 GPU 服務(wù)器提供大數(shù)據(jù)量的云存儲(chǔ)服務(wù)。 如何正確選擇GPU服務(wù)器? 選擇GPU服務(wù)器時(shí)首先要考慮業(yè)務(wù)需求來選擇適合的GPU型號(hào)。在HPC高性能計(jì)算中還需要根據(jù)精度來選擇,比如有的高性能計(jì)算需要雙精度,這時(shí)如果使用P40或者P4就不合適,只能使用V100或者P100;同時(shí)也會(huì)對(duì)顯存容量有要求,比如石油或石化勘探類的計(jì)算應(yīng)用對(duì)顯存要求比較高;還有些對(duì)總線標(biāo)準(zhǔn)有要求,因此選擇GPU型號(hào)要先看業(yè)務(wù)需求。 當(dāng)GPU型號(hào)選定后,再考慮用什么樣GPU的服務(wù)器。這時(shí)我們需要考慮以下幾種情況: 第一、 在邊緣服務(wù)器租用上需要根據(jù)量來選擇T4或者P4等相應(yīng)的服務(wù)器,同時(shí)也要考慮服務(wù)器的使用場景,比如火車站卡口、機(jī)場卡口或者公安卡口等;在中心端做Inference時(shí)可能需要V100的服務(wù)器,需要考慮吞吐量以及使用場景、數(shù)量等。 第二、 需要考慮客戶本身使用人群和IT運(yùn)維能力,對(duì)于BAT這類大公司來說,他們自己的運(yùn)營能力比較強(qiáng),這時(shí)會(huì)選擇通用的PCI-e服務(wù)器;而對(duì)于一些IT運(yùn)維能力不那么強(qiáng)的客戶,他們更關(guān)注數(shù)字以及數(shù)據(jù)標(biāo)注等,我們稱這類人為數(shù)據(jù)科學(xué)家,選擇GPU服務(wù)器的標(biāo)準(zhǔn)也會(huì)有所不同。 第三、 需要考慮配套軟件和服務(wù)的價(jià)值。 第四、 要考慮整體GPU集群系統(tǒng)的成熟程度以及工程效率,比如像DGX這種GPU一體化的超級(jí)計(jì)算機(jī),它有非常成熟的從底端的操作系統(tǒng)驅(qū)動(dòng)Docker到其他部分都是固定且優(yōu)化過的,這時(shí)效率就比較高。 |