圖說:HPE擴展次世代Cray超級運算產品組合,推出三款支援多合作夥伴與多重工作負載的運算刀鋒伺服器。
Hewlett Packard Enterprise(NYSE:HPE)宣布擴充次世代HPE Cray超級運算產品組合,提供業界領先的運算密度,以滿足人工智慧(AI)需求,同時支援大規模運算效能。本次HPE Cray Supercomputing產品組合的擴充,包含三款支援多合作夥伴與多重工作負載的運算刀鋒伺服器、統一管理軟體與高效能互連技術,為研究實驗室、主權機構與大型企業打造業界先進的超級運算架構,協助其運用AI進行模擬運算與科學探索。
「仰賴超級運算的企業組織,都在積極尋求能加速處理各類工作負載的強大運算效能,」HPE高效能運算與AI基礎架構解決方案部門資深副總裁暨總經理Trish Damkroger表示。「全新的HPE Cray Supercomputing平台正是客戶所需的答案。其統一的AI與HPC架構專為突破性成果而設計,能實現更高的效能密度。HPE秉持對AI與超級運算的堅定承諾,持續推動創新與科學探索,進而改變人們的生活與工作方式。」
此次產品組合的擴充延續上個月首度發表的HPE Cray Supercomputing GX5000,為專為在AI與HPC融合的時代推動超級運算突破而打造的專屬平台。其搭載全新的HPE Cray Supercomputing Storage Systems K3000,是業界首款內嵌分散式非同步物件儲存(DAOS)開源軟體的原廠建置儲存系統,能進一步提升運算效能。
次世代HPE Cray平台已獲業界採用
德國斯圖加特大學高效能運算中心(HLRS)及巴伐利亞科學與人文學院的萊布尼茨超級運算中心(LRZ),皆已選擇HPE Cray Supercomputing GX5000作為其次世代超級運算平台。這套次世代超級運算產品組合已獲得全球多個頂尖超級電腦中心採用,包括HLRS即將啟用的Herder超級電腦與LRZ的Blue Lion超級電腦,協助其開拓全新的科學研究領域。
「HPE曾為HLRS打造Hawk與Hunter超級電腦,多年來一直是HLRS的可靠合作夥伴,」HLRS主任Michael Resch教授表示。「HPE的超級電腦系統與專家支援,提升了我們在科學研究與產業用戶社群的研究能力,使其能夠取得突破性的科學發現並開發出更卓越的技術。隨著Herder超級電腦的到來,我們期待與HPE展開新一階段的合作。GX5000平台將大幅提升模擬和人工智慧的運算效能,帶給使用者全新體驗,同時提高能源效率,這也是我們HPC運算中心的首要考量。」
「LRZ的使命是提供世界級的高效能運算,推動具全球影響力的研究,同時確保超級電腦以高效且與永續的方式運作,」LRZ董事會主席Dieter Kranzlmüller教授表示。「而我們為次世代旗艦系統Blue Lion所選用的HPE Cray GX500平台,正好體現了對這項承諾的堅持。該系統採用100%直接液冷設計,能在高達攝氏40度的環境下運作,並讓加興研究園區(Garching reseach campus)內的廢熱回收再利用。Blue Lion的持續運算效能較現有系統提升三十倍,讓研究人員能夠順暢整合傳統建模與模擬工作流程及先進的AI方法,以前所未有的方式突破科學探索的疆界。」
採用直接液冷技術,並支援多合作夥伴與多重工作負載的運算處理刀鋒伺服器
此三款新的刀鋒伺服器均採用100%直接液冷設計,讓客戶以業界領先的效能密度支援次世代NVIDIA Rubin平台與AMD Instinct™ MI430X等旗艦GPU,或是代號「Venice」的新一代AMD EPYC™處理器等旗艦CPU。每片刀鋒均可配置四或八個HPE Slingshot 400 Gbps端點,並可選擇搭配兩個非揮發性記憶體(NVMe)固態硬碟(SSD)。此三款運算處理刀鋒伺服器可於HPE Cray Supercomputing GX5000運算機櫃中混合部署,讓客戶能依工作負載需求組成最適化配置,即使在小型部署環境中亦能充分發揮效能。
- HPE Cray Supercomputing GX440n加速刀鋒伺服器:搭載四顆NVIDIA Vera CPU與八顆NVIDIA Rubin GPU,為混合精確度運算提供通用運算引擎。每個運算機櫃最多可配置24片此刀鋒伺服器,且可容納多達192顆NVIDIA Rubin GPU,提供業界領先的NVIDIA Rubin GPU密度。
- HPE Cray Supercomputing GX350a加速刀鋒伺服器:適合希望使用AMD CPU與GPU架構進行混合精確度運算的客戶。此刀鋒採用代號為「Venice」的新一代AMD EPYC CPU與四顆專為主權AI和HPC打造的AMD Instinct™ MI430X GPU,該GPU為新一代MI400系列加速器。每個運算機櫃最多可配置28片此刀鋒,提供高達112顆AMD MI430X GPU的運算效能。
- HPE Cray Supercomputing GX250運算刀鋒伺服器:專為次世代超級電腦設計,搭載八顆新一代AMD EPYC「Venice」CPU,適合需要建立純CPU分區以支援雙精確度工作負載的客戶。超級電腦的GPU分區可依客戶偏好,靈活選擇前述任一款加速刀鋒伺服器進行建置。每個運算機櫃最多可配置40片此刀鋒,提供業界領先的旗艦級x86 CPU核心密度。
統一、多租戶且安全的系統管理體驗
HPE Supercomputing Management Software導入全新功能,可支援多租戶、虛擬化與容器化環境,讓客戶在部署融合AI與HPC的運算架構時擁有更高的靈活性,並在必要時隔離工作負載與使用者群組。此新軟體同時具備全系統的電力與能源管理功能,協助客戶監控用電狀況、預估能源消耗,並整合具備電力感知能力的排程系統,以最大化能源效率並預先掌握成本。
該軟體能在超級電腦生命週期的各個階段為AI與HPC基礎架構提供統一且安全的系統管理體驗,包括部署、監控、電力、冷卻與系統擴充等階段。全新功能也強化了安全防護機制,並提升治理報告能力。
HPE Slingshot 400現已支援GX5000系統
HPE Slingshot 400現可支援HPE Cray Supercomputing GX5000平台。此解決方案專為高密度的外型規格設計,能在融合AI與HPC的高負載環境中實現大規模效能。
全新機箱專為100%直接液冷的交換器刀鋒打造,配備64個400 Gbps埠,並支援以下部署組態:
- 8台交換器,共512個埠
- 16台交換器,共1,024個埠
- 32台交換器,共2,048個埠
HPE Slingshot 400交換器於去年首次發表,能充分運用HPE Cray Supercomputing GX5000高效能拓撲架構中的可用頻寬,協助客戶在控制成本的同時,獲得更低延遲、更高持續頻寬與更卓越的可靠性。
透過以DAOS為基礎的儲存解決方案提升AI應用生產力
HPE Cray Supercomputing Storage Systems K3000儲存系統採用HPE ProLiant Compute DL360 Gen12伺服器架構,具備業界領先的運算效能、可擴充的記憶體密度與高速資料傳輸能力,能運行要求嚴苛的應用程式。透過結合低延遲的DAOS架構,該系統可協助超級運算客戶以更高生產力執行I/O密集型的AI應用程式。
採用HPE ProLiant Compute伺服器的DAOS儲存伺服器可提供多種硬碟容量與組態選項,以配合不同的專案需求,包括:
- 效能最佳化的DAOS儲存伺服器,搭載8、12或16顆NVMe硬碟
- 容量最佳化的DAOS儲存伺服器,搭載20顆NVMe硬碟
- 硬碟容量選項包括3.84 TB、7.68 TB或15.36 TB
- 動態隨機存取記憶體(DRAM)組態選項包括512 GB、1,024 GB或2,048 GB,依選定的硬碟容量而定
連線選項則支援HPE Slingshot 200、HPE Slingshot 400、InfiniBand NDR或每秒400Gb的乙太網路。
專為超級運算設計的服務體驗
從最佳化應用效能、全球一站式部署到全天候營運支援,HPE超級運算服務協助客戶充分發揮並持續維持其投資價值。
身為全球超級運算領域的領導廠商,HPE憑藉數十年的專業經驗,持續推出先進且節能的AI與HPC解決方案。透過卓越的產品效能與擴充能力,HPE能協助客戶獲得推動創新所需的資源,實現更具挑戰性的研究與發展目標。
「最新的HPE Cray超級運算平台展現了AMD與HPE在HPC與AI融合領域的深度合作,攜手開發領先業界的創新技術,」AMD高效能運算與主權AI企業副總裁Travis Karr表示。「透過搭載AMD EPYC CPU與AMD Instinct GPU的高密度運算刀鋒伺服器,我們協助客戶利用可擴充且節能的解決方案應對全球最複雜的科學與AI挑戰。」
「搭載NVIDIA Vera Rubin的HPE次世代AI超級電腦專為加速科學探索而打造,」NVIDIA高效能運算、雲端與AI基礎架構資深總監Dion Harris表示。「在NVIDIA技術的支援下,HPE GX5000系統能提升模擬、分析與AI運算效能,提供推動AI產業革命所需的關鍵基礎架構。」
