圖說: Arm發布專為 AI 時代設計的全新平台 Arm Lumex CSS。左起Arm 首席應用工程師胡岱勛、Arm 應用工程總監徐達勇、Arm 終端產品事業部市場策略總監蔡武男。
Arm今(10)日宣佈推出全新 Arm Lumex 運算子系統(Compute Subsystem, CSS)平台,這是一套專為旗艦級智慧手機及次世代個人電腦加速其人工智慧(AI)體驗的先進運算平台。Lumex CSS 平台整合搭載第二代可擴展矩陣延伸指令集 2(SME2)技術的最高效能 Arm CPU、GPU 及系統 IP,不僅能協助生態系夥伴更快將 AI 裝置推向市場,還可支援桌機級行動遊戲、即時翻譯、智慧助理及個性化應用等多樣的豐富體驗。
Arm 資深副總裁暨終端產品事業部總經理 Chris Bergey 表示:「AI 已不再僅僅是一項技術功能,它已成為次世代行動與消費技術的基礎。藉由 Arm Lumex 平台,我們持續提升裝置端 AI 體驗,以滿足使用者日益成長的需求與期待。為此,我們正積極將 SME2 技術擴展至每一個 CPU 平台。預計到 2030 年,SME 與 SME2 技術將為超過 30 億台裝置新增超過 100 億TOPS 的運算能力,為裝置端 AI 效能帶來指數級的躍升。」
合作夥伴可靈活選擇使用 Arm Lumex 的方式,為其打造系統單晶片(SoCs)。例如,他們可直接採用 Arm 提供的平台,並借助為其需求客製的先進實體實作方案,進而獲得縮短產品上市時間和快速兌現效能價值等雙重優勢;或者,合作夥伴也可根據他們的目標市場,對硬體描述語言原始碼(RTL)設計進行配置,並自行完成核心模組的硬化工作。
全新 Arm Lumex 平台包含以下核心元件:
- 次世代搭載 SME2 技術的 Armv9.3 CPU 叢集:包括 Arm C1-Ultra 和 Arm C1-Pro,為旗艦裝置提供支援
- Arm C1-Premium:專為次旗艦市場打造,可提供一流的面積效率
- Arm Mali G1-Ultra GPU:配備次世代光線追蹤技術,在實現先進的圖像和遊戲體驗同時,還可提升整體 AI 效能
- Arm C1-DSU:Arm 迄今為止最靈活、高能效且具多種電源模式的 DynamIQ Shared Unit(DSU)
- 針對三奈米製程節點最佳化的實體實作
- 跨軟體堆疊的深度整合,為使用 KleidiAI 軟體函式庫的開發者提供無縫的 AI 加速體驗
搭載 SME2 技術的 CPU:協助實現全場景 AI 加速
搭載 SME2 的 Arm C1 CPU 叢集,為實際不同場景中的 AI 驅動型任務帶來顯著的 AI 效能提升,包括:
- AI 效能提升高達五倍
- 語音類工作負載延遲降低 4.7 倍
- 音訊生成速度提升 2.8 倍
全新的 Arm CPU 在 AI 運算能力上的飛躍,讓即時的裝置端 AI 推論成為現實,為使用者在音訊生成、電腦視覺及情境助理等多種互動場景中帶來更流暢、更快速的體驗。
在實際場景中,SME2 技術將回應速度與運行效率提升至全新水準。例如,在「智慧瑜伽教練」示範應用中,受惠於 SME2 技術,該應用的文字轉語音生成速度提升 2.4 倍,代表使用者能即時取得姿勢回饋與指導,且全程不用擔心裝置的電池續航問題。此外,透過 Arm、支付寶與 vivo 的三方合作下,將大語言模型(LLM)的互動回應時間縮短多達 40%,充分證明 SME2 可為終端裝置帶來更快速的即時生成式 AI 體驗。
SME2 技術的價值不僅在於速度的提升,更在於釋放出傳統 CPU 無法提供的 AI 驅動功能。例如,在搭載 SME2 的單個核心上運行類神經攝影機降噪功能,可以在 1080P 解析度下實現幀率超過 120 幀/秒(fps),或在 4K 解析度下實現幀率達 30fps。這使得智慧手機使用者即使身處光線最暗的場景,也能捕捉到更銳利、清晰的圖像,進而在日常裝置上獲得更流暢的互動操作與更豐富的使用體驗。
不同於受到延遲、成本及隱私問題等挑戰的雲端優先 AI,Lumex 將智慧導入裝置端,能夠在本地實現更快、更安全且隨時可用的智慧體驗。SME2 已經廣受業界領先的生態系夥伴的採用,包括阿里巴巴、支付寶、三星 System LSI、騰訊及 vivo。
為全產品級別賦予架構自由
Arm Lumex 為合作夥伴提供充分的自由度,使其能從高階智慧手機、PC 到新興的 AI 優先裝置等各類產品中,實現峰值效能、持續能效與晶片面積之間的靈活平衡。
CPU | 主要優勢 | 效能與能效提升 | 理想應用場景 |
Arm C1-Ultra | 旗艦級峰值效能 | 單執行緒效能提升25%,IPC 效能與前一代相比實現雙位數成長 | 大模型推論、運算攝影、內容創作、生成式 AI |
Arm C1-Premium | 兼具C1-Ultra效能且面積效率更優 | 相較於 C1-Ultra 面積縮減 35% | 次旗艦行動裝置市場、語音助理、多工處理 |
Arm C1-Pro | 持久高能效 | 持續效能提升 16% | 影片播放、串流推論 |
Arm C1-Nano | 極致能效 | 效率提升 26%,面積更小 | 穿戴裝置、超小型裝置 |
Mali GPU:實現桌機級遊戲體驗和更快的 AI 推論
隨著搭載 Arm GPU 的晶片累計出貨量突破 120 億顆,Arm 持續穩居手遊體驗領域的核心地位。全新的 Arm Mali G1-Ultra GPU 進一步突破行動遊戲的效能極限,為手遊玩家帶來逼真的、主機級畫質。這一突破受惠於全新的第二代光線追蹤(Ray Tracing Unit v2, RTUv2)技術,該技術顯著提升光照、陰影與反射效果,使其光線追蹤效能相較其前代提升兩倍。在 AI 工作負載方面,Mali G1-Ultra 可將推論效能提升最高達 20%,明顯強化各類即時應用的回應速度。
在各類圖像基準測試中,Mali G1-Ultra 較前代產品實現 20% 的效能提升,為《暗區突圍:無限》、《要塞英雄》、《原神》、《崩壞:星穹鐵道》等主流遊戲帶來全面的效能強化。同時,Mali G1-Premium 與 Mali G1-Pro 兩款 GPU,也為硬體資源受限的裝置提供更出色的效能與能效表現。
開發者友善的裝置端 AI 解決方案
開發者可在 Arm Lumex 平台上獲得立即可用的 AI 開發體驗。透過 KleidiAI 與各大主流框架的整合,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime,開發者無需修改任何程式碼,即可自動取得 SME2 的加速能力。
對於需要建構跨平台應用的開發者而言,Lumex 帶來全新的可移植性:
- Gmail、YouTube 和 Google Photos 等 Google 應用現已全面支援 SME2 ,搭載 Lumex 的裝置一經上市即可無縫運行
- 跨平台可移植性代表針對 Android 建構的最佳化功能,可無縫擴展至採用 Arm 架構的 Windows 及其他作業系統
- 支付寶等合作夥伴已成功驗證:藉由 SME2 技術,終端裝置上的大語言模型(LLM) 可實現高效運行。
Apple、三星和聯發科技等領先企業,正積極整合 AI 加速功能,推動裝置端 AI 向更快速、更高效的方向發展。其中,Apple 正憑藉該能力為「蘋果智慧」(Apple Intelligence)提供核心支撐;三星與聯發科技則借助 Google Gemini 提升翻譯、摘要、個人助理等即時 AI 應用的回應速度與運行效率。
Arm Lumex:AI 時代的平台級智慧
Arm Lumex 不僅是 Arm 針對消費運算市場的最先進 CSS 平台,更是開啟新時代智慧 AI 體驗的基礎。無論是 OEM 廠商還是開發者,Lumex 均可提供所需工具,協助其在關鍵裝置端的應用場景實現兼具個性化、隱私保障與高效能的 AI 體驗。做為專為 AI 時代打造的平台, Arm Lumex 將成為未來行動創新的全新起點。