了解CloudMatrix384超節(jié)點
了解CloudMatrix384超節(jié)點
支持最大支持16萬卡集群,用高速總線互聯(lián)替代傳統(tǒng)以太,通信帶寬提升15倍,通信時延降低10倍
支持EMS服務(wù),跨節(jié)點共享KV緩存,大幅降低首Token時延。支持SFS Turbo服務(wù),實現(xiàn)AI數(shù)據(jù)加載速度提升10倍
超節(jié)點+大規(guī)模專家并行的技術(shù),支持單卡性能提升近4倍,支持一卡一專家分布式推理部署,相較于非超節(jié)點推理性能提升4X
支持朝推夜訓(xùn),通過訓(xùn)推共池,訓(xùn)練資源池和推理資源池資源靈活調(diào)度,實現(xiàn)資源利用提升30%以上
-
全新超節(jié)點架構(gòu)算力底座支持最大超過10萬卡集群,用高速總線互聯(lián)替代傳統(tǒng)以太,通信帶寬提升15倍,通信時延降低10倍
-
AI數(shù)據(jù)加速更快支持EMS服務(wù),跨節(jié)點共享KV緩存,大幅降低首Token時延。支持SFS Turbo服務(wù),實現(xiàn)AI數(shù)據(jù)加載速度提升10倍
-
大規(guī)模集群性能更高超節(jié)點+大規(guī)模專家并行的技術(shù),支持單卡性能提升5到10倍,支持一卡一專家分布式推理部署,相較于非超節(jié)點推理性能提升3X
-
資源利用率提升支持朝推夜訓(xùn),通過訓(xùn)推共池,訓(xùn)練資源池和推理資源池資源靈活調(diào)度,實現(xiàn)資源利用提升30%以上
為什么選擇昇騰云
領(lǐng)先的昇騰架構(gòu)
昇騰達(dá)芬奇架構(gòu)領(lǐng)先,算力相比友商提升30%+;
MindSpore原生支持大模型開發(fā),千億參數(shù)模型調(diào)優(yōu)時間縮短60%。
高效的遷移工具鏈
全流程昇騰遷移工具鏈,典型場景遷移至生產(chǎn)環(huán)境<2周;
易用的訓(xùn)練、推理遷移工具,支撐客戶自主昇騰遷移。
極致的資源利用
統(tǒng)一資源調(diào)度,資源極致利用,綜合分配率達(dá)90%;
彈性調(diào)度、訓(xùn)練&推理融合調(diào)度,資源發(fā)放<30分鐘。
豐富的生態(tài)
AI Gallery生態(tài)繁榮,沉淀行業(yè)資產(chǎn)10萬+;
匯聚主流開源大模型,高效連接云上昇騰算力。