近日,以“擁抱AI變革,點(diǎn)燃算網(wǎng)引擎”為主題的2025開放數(shù)據(jù)中心大會(huì)(ODCC)成功舉辦。大會(huì)共公布63項(xiàng)技術(shù)成果,并評(píng)選出15項(xiàng)年度卓越成果,覆蓋服務(wù)器、數(shù)據(jù)中心設(shè)施、網(wǎng)絡(luò)、邊緣計(jì)算等多個(gè)關(guān)鍵領(lǐng)域。安擎計(jì)算機(jī)信息股份有限公司(以下簡(jiǎn)稱‘安擎’)憑借《Switchless Scale Up GPU超節(jié)點(diǎn)互聯(lián)系統(tǒng)架構(gòu)技術(shù)規(guī)范》項(xiàng)目,榮獲ODCC年度卓越成果最高級(jí)別認(rèn)可,成為業(yè)內(nèi)關(guān)注的焦點(diǎn)。
該項(xiàng)目基于業(yè)界首創(chuàng)的“Switchless Scale Up與Switch Scale Out雙向融合”架構(gòu),采用先進(jìn)光互聯(lián)技術(shù),構(gòu)建靈活、高效的GPU超節(jié)點(diǎn)互聯(lián)方案。該技術(shù)直擊“閉源斷困”與“開源滯后”兩大行業(yè)痛點(diǎn),以開源綠色為理念,突破傳統(tǒng)Scale Up交換機(jī)的限制,支持多規(guī)模超節(jié)點(diǎn)靈活組網(wǎng)與拓?fù)鋭?dòng)態(tài)切換,滿足多樣化AI模型的算力需求。系統(tǒng)具備容錯(cuò)冗余機(jī)制,顯著提升可靠性,最終實(shí)現(xiàn)GPU互聯(lián)成本下降與能效躍升,為GenAI算力集群開辟開放互聯(lián)新路徑。
在本次ODCC峰會(huì)中,安擎首席架構(gòu)師代表公司分享了題為《AI系統(tǒng)全棧性能工程的革新之路》的技術(shù)報(bào)告。面對(duì)大模型訓(xùn)練成本高、算力需求激增等挑戰(zhàn),指出全棧性能工程已成為破局關(guān)鍵,需通過(guò)硬件、軟件與算法的協(xié)同創(chuàng)新,實(shí)現(xiàn)高效與高擴(kuò)展的統(tǒng)一。報(bào)告提出以有效吞吐量為核心、追求數(shù)量級(jí)性能突破、剖析驅(qū)動(dòng)精準(zhǔn)優(yōu)化等六大策略,并引用多個(gè)國(guó)際領(lǐng)先案例,展現(xiàn)全棧性能工程在訓(xùn)練-推理協(xié)同優(yōu)化中的重要作用。
未來(lái),安擎將持續(xù)攜手ODCC及業(yè)界生態(tài)伙伴,以全棧性能工程為核心推動(dòng)力,共同推進(jìn)算力基礎(chǔ)設(shè)施向高效、綠色與智能方向演進(jìn),構(gòu)筑一個(gè)更具活力和可持續(xù)性的算力新生態(tài)。
返回列表