以客戶為中心,提供定制化或一站式的全棧解決方案,賦能千行百業(yè)
GPU計算是指利用圖形卡來進行一般意義上的計算,而不是傳統(tǒng)意義上的圖形繪制。時至今日,GPU已發(fā)展成為一種高度并行化、多線程、多核的處理器,具有杰出的計算功率和極高的存儲器帶寬。如圖:
具體地說,GPU專用于解決可表示為數(shù)據(jù)并行計算的問題——在許多數(shù)據(jù)元素上并行執(zhí)行的程序,具有極高的計算密度(數(shù)學(xué)運算與存儲器運算的比率)。由于所有數(shù)據(jù)元素都執(zhí)行相同的程序,因此對精密流控制的要求不高;由于在許多數(shù)據(jù)元素上運行,且具有較高的計算密度,因而可通過計算隱藏存儲器訪問延遲,而不必使用較大的數(shù)據(jù)緩存。
數(shù)據(jù)并行處理會將數(shù)據(jù)元素映射到并行處理線程。許多處理大型數(shù)據(jù)集的應(yīng)用程序都可使用數(shù)據(jù)并行編程模型來加速計算。在 3D渲染中,大量的像素和頂點集將映射到并行線程。類似地,圖像和媒體處理應(yīng)用程序(如渲染圖像的后期處理、視頻編碼和解碼、圖像縮放、立體視覺和模式識別等)可將圖像塊和像素映射到并行處理線程。實際上,在圖像渲染和處理領(lǐng)域之外的許多算法也都是通過數(shù)據(jù)并行處理加速的——從普通信號處理或物理仿真一直到數(shù)理金融或數(shù)理生物學(xué)。在上述領(lǐng)域,GPU計算已經(jīng)獲得了成功的應(yīng)用,并取得了令人難以置信的加速效果。
整套GPU高性能方案采用通用CPU和專用GPU均衡設(shè)計,既保證了GPU的處理性能,又兼顧了通用CPU的計算能力。既保證了適合GPU的高并行度計算應(yīng)用的需求,同時也保證了非高并行度應(yīng)用和尚未進行GPU移植的應(yīng)用需求。并且由于GPU具有較高浮點計算性能的特點,方案中使用GPU作為主體計算資源,將圖形處理器引入到高性能計算領(lǐng)域。
GPU計算節(jié)點使用了寶德PR4910P,該機型有著超高的擴展性,GPU方面最多支持到10個全高全長的GPU插槽。同時支持多種的網(wǎng)絡(luò)支持,可實現(xiàn)增強的高速性能和 I/O 靈活性,滿足不同應(yīng)用程序的互聯(lián)需。
存儲節(jié)點采用了寶德PR4036P4機型,具有高可擴充性和高可用性,能夠解決數(shù)據(jù)爆炸性增長帶來的存儲挑戰(zhàn),并且支持智能陣列,顯著增強I/O性能和數(shù)據(jù)的安全性。
在網(wǎng)絡(luò)通信方面所有節(jié)點通過高速的Infiniband網(wǎng)絡(luò)連接,實現(xiàn)節(jié)點之間的全互聯(lián),大大降低節(jié)點之間的通信延遲,為集群提供了一個高帶寬低延遲的IO和網(wǎng)絡(luò)數(shù)據(jù)交換性能環(huán)境。
系統(tǒng)支持CPU和GPU的混合計算。系統(tǒng)具有較高的計算密度,可在實現(xiàn)超過500TFlops(單精度)的計算能力,同時具有良好的可擴展性,能夠輕松擴展到千萬億次。
GPU節(jié)點、存儲節(jié)點、計算節(jié)點等有很高的擴展性,既能滿足現(xiàn)階段的業(yè)務(wù)要求,也能更具未來業(yè)務(wù)量的增長進行升級和擴容。
寶德通過統(tǒng)一的集群管理、作業(yè)調(diào)度,結(jié)合寶德高性能的服務(wù)器,從各個方面提高整套系統(tǒng)的穩(wěn)定性,大大提高用戶的使用穩(wěn)定性同時減少了故障率。
服務(wù)超越
行業(yè)多年經(jīng)驗的HPC專家可為用戶提供應(yīng)用級別的運維服務(wù),協(xié)助用戶應(yīng)用調(diào)優(yōu),發(fā)現(xiàn)問題,提供專業(yè)的解決方案。