圖說:HPE推出具備高效率大規模運算能力的新一代NVIDIA Vera Rubin NVL72 by HPE機架級系統。
HPE宣布擴展NVIDIA AI Computing by HPE產品組合,推出多項針對大規模AI工廠與超級電腦的重大創新,協助客戶擴展規模、提升部署效率並加快獲取洞察。這些結合NVIDIA技術的全堆疊AI解決方案整合了運算、GPU、網路、液冷技術、軟體與服務,專為大規模與主權環境打造。美國阿貢國家實驗室、德國斯圖加特大學高效能運算中心(HLRS)、HRT (Hudson River Trading)以及韓國科學技術研究院(Korea Institute of Science and Technology, KIST)等前瞻AI組織與頂尖研究機構皆已採用搭載NVIDIA技術的HPE AI基礎架構與AI工廠,以推動創新發展。
HPE將NVIDIA AI解決方案導入其業界領先的超級運算平台
研究實驗室、主權機構與大型企業正加速導入AI,以強化傳統高效能運算(HPC)工作負載。為協助組織加速科學研究突破,HPE正將NVIDIA產品整合至專為統合AI與HPC所設計的第二代百萬兆級超級運算平台HPE Cray Supercomputing GX5000,包括:
- 首批搭載NVIDIA Vera CPU的運算刀鋒-HPE於其新一代高效能超級運算解決方案產品線中新增液冷式NVIDIA運算刀鋒選項。每個HPE Cray Supercomputing GX240運算刀鋒最高可搭載16顆NVIDIA Vera CPU,可支援嚴苛的AI運算工作負載。GX240在NVIDIA Vera平台上提供業界領先的運算密度,每個機櫃最高可擴展至40個刀鋒,配置640顆NVIDIA Vera CPU,以及56,320個與NVIDIA Olympus Arm架構相容的核心。
- 更多高效能網路選擇-企業可依需求自訂超級電腦的配置,選擇最適合大規模系統的網路,包括NVIDIA Quantum-X800 InfiniBand。NVIDIA Quantum-X800 InfiniBand交換器將支援HPE Cray Supercomputing GX5000,提供144個連接埠,每埠可提供每秒800 GB的連線能力,並具備低功耗連線狀態與功耗分析等節能功能。
「HPE打造了全球最強大的三座百萬兆級超級電腦,透過結合先進的AI工作負載與傳統HPC加速科學突破,持續引領創新,」HPE高效能運算與AI基礎架構解決方案部門資深副總裁暨總經理Trish Damkroger表示。「我們與NVIDIA持續合作,協助客戶獲得所需的高效能運算密度,突破醫學、生命科學、工程、製造等領域的技術極限。」
與NVIDIA共同設計,強化HPE AI Factory的大規模與主權部署能力
除了持續提升業界領先的超級運算平台外,HPE亦導入NVIDIA Vera Rubin平台與NVIDIA Blackwell架構,進一步強化HPE AI Factory產品組合,以因應服務供應商、主權機構與大型企業的需求。
- 為新興雲端供應商打造大規模AI部署解決方案-HPE推出新一代NVIDIA Vera Rubin NVL72 by HPE機架級系統,這是專為超過1兆參數的前沿等級(frontier-scale)模型所打造的旗艦級AI系統。此系統具備高效率的大規模運算能力,可滿足新興雲端供應商的需求。其搭載36顆NVIDIA Vera CPU、72顆NVIDIA Rubin GPU、第六代NVIDIA NVLink縱向擴展網路、NVIDIA ConnectX‑9 SuperNIC與NVIDIA BlueField‑4 DPU,同時結合HPE的液冷技術、服務與資料中心設計專業能力,大幅簡化大規模AI部署。
- 用於支援AI模型訓練與推論的高密度GPU伺服器-HPE Compute XD700是採用NVIDIA HGX Rubin NVL8平台的全新AI伺服器,且獲得開放運算計畫(Open Compute Project)授予的OCP Inspired認證。此系統可在每個機櫃中提供更高的GPU密度,同時降低空間、電力與散熱成本,並提升AI訓練與推論的處理效能。每個XD700機櫃可支援多達128顆Rubin GPU,GPU密度較前一代提升一倍。
- 更廣泛的NVIDIA Blackwell存取能力-NVIDIA RTX PRO 6000 Blackwell Server Edition GPU現已全面支援HPE所有AI工廠方案。
這些解決方案進一步搭配多項HPE與NVIDIA軟體與服務更新,協助客戶在推動大規模AI專案時加快部署速度。
- HPE AI工廠產品組合通過NVIDIA雲端合作夥伴計畫認證-透過與NVIDIA持續進行工程協作,HPE的AI工廠解決方案已符合NVIDIA雲端供應商認證標準,能協助雲端服務供應商簡化驗證流程。
- 擴展大規模AI部署的多租戶選項 – HPE強化HPE AI Factory產品組合,透過SUSE Virtualization及SUSE Rancher Prime Suite啟用NVIDIA多執行個體GPU(MIG),支援以GPU直通方式運行虛擬機器(VM),並提供安全的Kubernetes命名空間,讓服務供應商依客戶需求,靈活選擇硬式或軟式租戶部署模型。
- 整合Red Hat-HPE AI 工廠產品組合現已支援Red Hat AI Enterprise中的Red Hat Enterprise Linux與OpenShift,並可與NVIDIA AI Enterprise解決方案整合,適用於需要企業級Linux作業系統的客戶。
- HPE AI 工廠支援Mission Control-針對大規模與主權AI部署所設計的HPE AI 工廠將支援NVIDIA Mission Control軟體,包括透過NVIDIA Run:ai進行工作負載協調,以及透過NVIDIA Dynamo提供監控與自主復原機制。此可全面簡化AI工廠的各項管理任務,並協助平台團隊提升營運效率、穩定擴展。
上述解決方案均奠基於HPE在資料中心設計與液冷技術領域的服務與專業能力,這些能力源自HPE數十年來建置全球最大規模、能源效率最高之超級電腦的豐富經驗。
「要充分發揮AI的潛力,企業與各國需要能承載大規模模型訓練與HPC工作負載的基礎架構,」NVIDIA企業平台副總裁Chris Marriott表示。「HPE與NVIDIA攜手開發全堆疊AI基礎架構,整合加速運算、先進網路與液冷技術,協助客戶在大規模與主權環境中加速獲得洞察。」
