華為開發者大會HDC 2025上,華為云計算迎來重大突破,華為常務董事及云計算CEO張平安隆重推出了盤古大模型5.5版本。此次升級覆蓋了自然語言理解NLP、計算機視覺CV、預測、多模態以及科學計算五大核心領域,為行業注入了全新的活力與價值。
張平安在大會上強調,盤古大模型5.5是基于昇騰云的強大全棧軟硬件環境訓練而成,這一里程碑式的成就標志著昇騰架構在全球大模型領域的卓越實力。他的話語中充滿了自豪與期待。
在NLP領域,盤古大模型5.5引入了全新的718B深度思考模型,這是一個由256位專家構成的MoE(混合專家)大模型。它在知識推理、工具調用及數學等多個維度實現了顯著增強,展現了業界領先的能力。通過一系列創新算法,如通算掩蓋、全局動態均衡以及分組混合專家MoGE,盤古大模型在昇騰平臺上實現了高效訓練和推理,MFU訓練和單卡推理吞吐均達到了業界頂尖水平。
盤古大模型5.5在用戶體驗方面進行了全面升級,特別是在高效長序列處理、低幻覺現象控制、快慢思考融合以及Agent技術等方面。其中,自適應快慢思考合一技術尤為引人注目。該技術通過構建難度感知的數據集和兩階段漸進式訓練,使模型能夠根據問題的難易程度靈活切換思考模式,從而在簡單問題上迅速響應,在復雜問題上則進行深入思考。這一創新使得整體模型的推理效率提升了8倍。
盤古深度研究工具DeepDiver同樣表現出色。通過長鏈難題合成和漸進式獎勵等關鍵技術,DeepDiver在網頁搜索、常識性問答等應用場景中展現出了極高的執行效率。例如,它能夠在5分鐘內完成超過10條的復雜問答,并生成萬字以上的專業調研報告,極大地提升了工作效率。
在大會上,張平安還分享了盤古大模型在計算機視覺CV、預測、多模態以及科學計算等基礎模型方面的技術升級。這些升級不僅提升了模型的性能和準確性,還為農業、工業、科研等多個領域帶來了豐富的創新應用和落地實踐。盤古大模型正逐步成為行業AI領域的先鋒力量,為解決行業難題提供了強有力的支持。