HPE機器學習開發系統 加速大量AI模型開發訓練

圖說:HPE機器學習開發系統(HPE Machine Learning Development System)

圖說:HPE機器學習開發系統(HPE Machine Learning Development System)

慧與科技(HPE)發布新HPE機器學習開發系統(HPE Machine Learning Development System),協助企業組織大規模建立與訓練機器學習模型,加速創造價值。這個專為AI設計的系統是端對端解決方案,整合機器學習軟體平台、運算、加速器和網路,幫助客戶更快開發與訓練大量的AI模型,同時提升模型準確度。

HPE機器學習開發系統建置於HPE策略投資收購公司—Determined AI的強大的機器學習(ML)平台上(現已正式命名為HPE機器學習開發環境),並結合HPE世界級的AI與高效能運算(HPC)產品。藉由新HPE機器學習開發系統,使用者可以縮短建立與訓練機器學習模型的時間,從數月、數週到數天,加速創造價值。

率先使用HPE機器學習開發系統的企業以飛快速度展開大規模多模態AI模型訓練

HPE宣布德國AI新創公司Aleph Alpha使用HPE機器學習開發系統訓練多模態AI模型,包括自然語言處理(NLP)與電腦視覺。藉由結合五種語言的影像與文字處理能力跟人類般的情境脈絡理解能力,這些模型可以讓現代AI技術應用在各種語言以及基於影像轉換的使用案例;例如,使用AI助理產生複雜文字、更高理解度的摘要、在數百個檔案中精準搜尋資訊,以及在對話情境中運用專業知識。 

在結合和監控數百個GPU情況下,Aleph Alpha不僅能立即安裝與使用HPE機器學習開發系統,還能以前所未有的速度和效率訓練模型。

「HPE機器學習開發系統可以提供超過150 TeraFlops以上的驚人效率與效能,」Aleph Alpha創辦人暨執行長Jonas Andrulis指出。「我們結合現有研究資料執行大量工作負載時,整合型解決方案大大提升部署與監控效率。」

「企業希望導入AI與機器學習技術,以創造產品和服務的差異性,但大規模建立與訓練準確的AI模型需要部署複雜的基礎架構,」HPE執行副總裁暨HPC與AI部門總經理Justin Hotard表示。「HPE機器學習開發系統,結合我們為深度學習所提供的端對端HPC解決方案以及創新的機器學習軟體平台到單一系統,提供一個立即可用的高效能解決方案,協助客戶加快運用AI創造價值與獲得成效。」

使用完整的機器學習解決方案移除障礙,充分發揮AI潛力

企業組織的AI基礎架構仍不夠成熟。根據IDC研究,若企業想要加速實驗或建立原型以開發AI產品和服務,AI基礎架構是最重要也是最昂貴的投資。若要使用AI基礎架構支援大規模的模型開發與訓練,企業必須經歷複雜且繁瑣的流程,包括採購、安裝設定與管理極為相似的軟體生態系統和基礎架構,而生態系統與基礎架構又涵蓋專業的運算、儲存、連線和加速器等資源。

HPE機器學習開發系統讓企業組織擺脫AI基礎架構的高複雜性。透過結合軟體平台以及加速器、網路與服務等專業運算資源的單一解決方案,讓企業組織可以立即大規模地建立與訓練最佳化的機器學習模型。

使用HPE機器學習開發系統獲得準確的模型,加速創造價值

此系統提供機器學習演算法的多種關鍵功能,包括卓越的分散式訓練、自動超參數最佳化與神經網路架構搜索,能更快提升模型的準確性。

HPE機器學習開發系統提供最佳化的運算、加速計算及連線。這些都是關鍵效能的驅動因素,可有效擴大模型規模以適應各種 工作負載。客戶可以從 32 個 NVIDIA GPUs 小型配置,逐步擴大到 256 NVIDIA GPUs配置。在32個NVIDIA GPUs組態中,HPE機器學習開發系統可擴充自然語言處理(NLP)與電腦視覺等工作負載的效率達到90%。根據內部測試,使用32個GPUs的HPE機器學習開發系統處理NLP工作負載時,傳輸率比其他搭載32個相同GPUs解決方案快5.7倍,連線效能則是次優。

透過立即可用的AI模型開發與訓練解決方案 加速從概念驗證到生產環境

HPE機器學習開發系統是整合型解決方案,能提供預先配置且完整安裝的AI基礎架構,讓客戶透過單一解決方案大規模開發與訓練模型。在此解決方案中,HPE Pointnext Services會提供現場安裝與軟體設定服務,讓使用者立即使用與訓練機器學習模型,更快透過資料獲得更準確的洞察力。


圖說:HPE Apollo 6500 Gen10 Plus系統。

HPE機器學習開發系統初步會提供小型的建構模組,並允許客戶自由擴充。此小型組態包含:

  • 透過 HPE機器學習開發環境提供創新的機器學習平台,協助企業迅速開發、重複使用與擴充高品質的模型,從概念驗證到生產。
  • 透過HPE Apollo 6500 Gen10 Plus系統最佳化AI基礎架構,針對AI模型的訓練及最佳化提供廣泛且專業的運算功能,並配備8個NVIDIA A100 80GB GPUs以加速運算處理效能。
  • 透過 HPE效能叢集管理(Performance Cluster Management)系統管理軟體解決方案,提供精細、集中的監控與管理,最佳化其效能。
  • 透過HPE ProLiant DL325 伺服器及1Gb速度Aruba CX 6300交換器提供管理堆疊,控管系統元件。
  • 透過NVIDIA Quantum InfiniBand網路平台確保運算、儲存與通訊效能。

HPE擴大AI產品組合,幫助客戶提升洞察力並做出更明智的決策

HPE宣布多項新AI產品,包括HPE群體學習解決方案,這是業界第一個能保護資料隱私、去中心化的機器學習架構,用於邊緣或分散站點。HPE群體學習解決方案讓醫療服務供應商、銀行、金融服務業及製造業等企業組織共用AI模型的學習內容,並在不共享實際資料的情況下獲得更高的洞察力。

HPE也宣布與高通科技(Qualcomm Technologies)合作,提供先進的AI推論解決方案,支援可執行大規模AI推論的異質系統架構。HPE將提供針對資料中心外部嚴苛環境優化且堅固耐用的小型邊緣運算解決方案—HPE Edgeline EL8000融合式邊緣系統,並與Qualcomm Cloud AI 100加速器一起為資料中心與邊緣提供推論服務。這個整合型解決方案能讓需要達到嚴苛要求的AI推論工作負載以低成本獲得高效能。