在中國移動哈爾濱智算中心,一場聚焦萬卡集群智能運(yùn)維的沙龍活動圓滿落幕。此次活動由中國通信標(biāo)準(zhǔn)化協(xié)會TC628標(biāo)準(zhǔn)推進(jìn)委員會攜手WG3智算運(yùn)維工作組及黑龍江移動聯(lián)合舉辦,匯聚了來自信通院、黑龍江省通信管理局、寧波銀行、螞蟻集團(tuán)、華為、科大訊飛、南瑞瑞騰、中科海光等多個領(lǐng)域的20余家單位代表,覆蓋了通信、金融、能源、制造及互聯(lián)網(wǎng)等多個行業(yè)。
活動現(xiàn)場,以“萬卡賦智,重塑運(yùn)維”為主題,通過主題演講與圓桌會議的形式,深入探討了智能計算基礎(chǔ)設(shè)施運(yùn)維的智能化轉(zhuǎn)型之路。專家們圍繞先進(jìn)經(jīng)驗分享、行業(yè)痛點剖析以及產(chǎn)學(xué)研深度融合三大板塊,交流了各自在智算運(yùn)維領(lǐng)域的探索與實踐,共同展望智算運(yùn)維的未來趨勢與面臨的挑戰(zhàn)。
黑龍江移動作為承辦方,分享了其基于集團(tuán)公司“五個一”卓越智算運(yùn)維體系推出的“12821”智算運(yùn)維方法論,詳細(xì)介紹了集省專協(xié)同流程優(yōu)化、機(jī)房現(xiàn)場標(biāo)準(zhǔn)化管理、主動運(yùn)維能力提升以及跨層跨域定界處置等方面的創(chuàng)新實踐,為大規(guī)模智算集群運(yùn)維提供了寶貴的經(jīng)驗借鑒。
螞蟻集團(tuán)則聚焦于萬卡集群模型訓(xùn)練異常分類與支撐手段,分享了其在模型訓(xùn)練、節(jié)點異常、調(diào)度異常等多場景下的時間、空間診斷思路與實踐成果,為參會者提供了豐富的實戰(zhàn)案例。
信通院在會上介紹了近年來IT運(yùn)維領(lǐng)域的標(biāo)準(zhǔn)研究工作及成果,重點解讀了《智算運(yùn)維能力成熟度模型》系列標(biāo)準(zhǔn),并表達(dá)了未來將加速構(gòu)建智算運(yùn)維領(lǐng)域標(biāo)準(zhǔn)生態(tài),全力支持行業(yè)智算運(yùn)維能力建設(shè)的決心。
沙龍還通過理論研討與實地參觀相結(jié)合的方式,為政產(chǎn)學(xué)研各界搭建了深度交流平臺,促進(jìn)了行業(yè)間的業(yè)務(wù)合作與交流。與會嘉賓圍繞智算運(yùn)維服務(wù)的新變化與挑戰(zhàn)、智算運(yùn)維如何加速AI應(yīng)用生態(tài)發(fā)展等議題展開了熱烈討論,并達(dá)成了多項共識。
此次沙龍的成功舉辦,標(biāo)志著我國智算運(yùn)維領(lǐng)域步入了標(biāo)準(zhǔn)化、協(xié)同化發(fā)展的新階段。中國移動(哈爾濱)智算中心在智算運(yùn)維領(lǐng)域的卓越能力與經(jīng)驗分享,得到了社會各界的廣泛認(rèn)可。隨著各方合作的不斷深化,智算集群的高效運(yùn)維將為人工智能大模型的訓(xùn)練與推理、行業(yè)智能化轉(zhuǎn)型提供更加堅實的算力支撐,助力我國在全球智算競爭中搶占先機(jī)。