時間:2023-09-05來源:本站
8月的最后一天,大模型賽場最新消息:百度文心一言、百川大模型、質(zhì)譜清言等官宣率先通過《生成式人工智能服務管理暫行辦法》備案,即日起可面向全社會開放服務。據(jù)悉,包含這3支大模型在內(nèi),國內(nèi)共有11家大模型陸續(xù)通過《生成式人工智能服務管理暫行辦法》備案,并于8月31日起將陸續(xù)向全社會公眾開放服務。這也預示著大模型之戰(zhàn)從拼技術、拼參數(shù)轉(zhuǎn)向拼應用、拼落地,但是應用為王的大模型,依然離不開強悍堅實的AI算力底座。
作為中國領先的計算產(chǎn)品服務提供商和中國AI服務器市場TOP3,寶德計算全新AI算力方案致力于為大模型的萬千應用和服務夯實底座。
寶德AI訓練服務器PR4910E+L40S
大模型加速訓練利器
大模型訓練需要海量數(shù)據(jù)的運算和處理,計算王者寶德AI訓練服務器PR4910E是不二之選。PR4910E支持10張全新發(fā)布的NVIDIA L40S GPU卡,同時采用2顆身懷七大算力神器的第四代英特爾®至強®可擴展處理器,最大可達60核心,為大模型訓練提供強有力的算力支撐。它具有13個PCIe x16 Gen5插槽,支持32個 DIMM / DDR5內(nèi)存插槽,支持最新的400Gb ETH和NDR IB高速智能網(wǎng)卡,以及 GPU Direct RDMA,最多支持24個 NVMe SSD,而且采用CPU 直通設計,大幅降低 I/O 延遲,為大模型數(shù)據(jù)存儲和傳輸提供高效可靠的保證。此外,它采用整機模塊化設計,支持靈活切換 CPU 和 GPU 的異構(gòu)拓撲結(jié)構(gòu),非常便于用戶的系統(tǒng)維護和管理。該產(chǎn)品已經(jīng)廣泛應用于大模型、人工智能、深度學習、神經(jīng)網(wǎng)絡,賦能醫(yī)學、材料、金融、科技等千行百業(yè)智能化轉(zhuǎn)型和應用。
寶德AI服務器PR8908WG+ Gaudi®2
大模型性價比之王
以大模型算力性價比著稱的寶德AI服務器PR8908WG,采用第三代英特爾®至強®可擴展處理器,8U空間支持8顆OAM高速互聯(lián)的Gaudi®2 AI加速器,每顆Gaudi®2芯片配置96GB HBM高速內(nèi)存,GPU與 GPU 之間互聯(lián)帶寬達到400GB/s,提供2.1Tbps的P2P互聯(lián)帶寬,支持全互聯(lián)拓撲,全面滿足大模型訓練的海量通信需求;擁有32個DDR4 DIMM插槽,支持24塊2.5英寸SAS/SATA熱插拔硬盤位,采用 CPU 直通設計,降低 I/O 延遲;它支持200Gb ETH和HDR高速智能網(wǎng)卡,支持GPU Direct RDMA,完美滿足集群和超大規(guī)模擴展應用。
PR8908WG整機采用模塊化設計,獨立的GPU和CPU 熱量分區(qū)設計確保系統(tǒng)在最苛刻的工作負載下性能和穩(wěn)定性不受影響,也非常方便用戶對AI算力設備的維護管理。它可以滿足AI不同場景下海量數(shù)據(jù)的計算和推理需求,特別適用于大模型訓練和推理、深度學習、自動駕駛、智能城市、醫(yī)療健康、大數(shù)據(jù)、高性能計算 (HPC) 和虛擬現(xiàn)實等應用場景,幫助加速更多AI技術的落地和應用。
寶德自研AI推理服務器PR2715E
大模型應用的得力助手
大模型上線開放服務之時,模型推理應用的工作負載將面臨更多的挑戰(zhàn),寶德自研AI推理服務器PR2715E可以成為其落地應用的得力幫手。它具有極致性能、卓越能效和能打的顏值,專注于高性能計算推理、云計算和數(shù)據(jù)中心等算力需求。
PR2715E采用2顆第四代英特爾®至強®可擴展處理器,提供強大的通用計算能力,支持DDR5、PCIe 5.0和HBM,性能提升高達50%;支持異構(gòu)設計,可以支持8張單寬或3張雙寬GPU卡,擁有強勁的AI推理算力和安全性能。它有32個內(nèi)存插槽,最大可支持8TB;它最大支持12個2.5 ”( 3.5”)和4個后置2.5 "SATA/SAS/NVMe熱插拔硬盤,或24個2.5 ”SATA/SAS/NVMe 和2個后置2.5 ”SATA/SAS熱插拔硬盤,支持內(nèi)置1個M.2(NVMe/SATA),保障了整機性能的強勁可靠;此外,PR2715E具有智能散熱系統(tǒng)、支持液冷散熱,能夠進一步幫助用戶降低TCO。
寶德自研商用并行存儲系統(tǒng)PLStor GS9200
大模型存力之基
隨著大模型規(guī)模的提升和落地應用,海量數(shù)據(jù)的指數(shù)級增長勢必帶來存儲和處理這些數(shù)據(jù)的更多難題。因此,強大的存力成為大模型有效服務的基礎保障之一。寶德PLStor GS9200是一款面向大模型多應用場景,以性能為中心,具備高可靠、簡單易用和豐富企業(yè)級功能等優(yōu)勢的領先并行存儲系統(tǒng)。其存儲集群支持無上限的大規(guī)模擴展,可以輕松擴展到EB級別,并能夠承載上萬臺AI/異構(gòu)算力服務器,滿足大容量存儲需求。
寶德PLStor GS9200提供了業(yè)內(nèi)領先的基于OS內(nèi)核程序優(yōu)化設計的原生客戶端,以一客戶端對多臺存儲節(jié)點的方式并行讀寫數(shù)據(jù),支持RDMA技術,整個系統(tǒng)能提供上TB/s級的吞吐帶寬。它采用存算融合的設計,可以整合計算節(jié)點內(nèi)的存儲資源,構(gòu)建全局命名空間的近線存儲池,實現(xiàn)靈活配置數(shù)量來擴展GPU/CPU計算資源和存儲資源,以滿足動態(tài)擴展的業(yè)務需求。PLStor GS9200數(shù)據(jù)湖存儲支持塊、文件、對象、大數(shù)據(jù)等存儲協(xié)議,并且支持POSI/NFS/CIFS/HDFS/S3/Swift等多種協(xié)議互通,實現(xiàn)平臺高效管理,而且保證在數(shù)據(jù)安全性、高并發(fā)讀寫、高空間利用率三者皆得,滿足不同場景下的數(shù)據(jù)安全存儲和訪問需求。
大模型發(fā)展如火如荼,成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,大模型競相上線開放服務標志著大模型應用時代即將到來。寶德計算將乘勢而上,繼續(xù)發(fā)揮技術優(yōu)勢和市場經(jīng)驗,打造先進的AI全棧算力方案,助力推動大模型的落地應用,為中國AI產(chǎn)業(yè)創(chuàng)新應用提供源源不斷的新動力!