北京 2025年7月3日 /美通社/ -- 近日,北京積算科技有限公司(以下簡稱"積算科技")正式推出GPU裸金屬算力服務套件,幫助客戶實現并行環境的分鐘級部署與出廠級性能校準,在GPU裸金屬算力上高效構建性能可靠的企業級服務,為千億參數大模型訓練、推理、深度學習和大數據分析等場景提供高效、穩定、優質的算力基座。
裸金屬算力兼具物理機的超強性能與云計算的靈活服務,并具備低延遲、強資源隔離、按需購買、靈活擴容、高性價比等優勢,深受科技企業與高校科研用戶青睞。然而在開通裸金屬算力后的首要任務——部署系統環境階段,用戶經常面臨步驟繁瑣、周期長、性能優化困難、缺乏自動化部署工具等諸多挑戰。
首先,部署過程涉及數十個驅動程序與軟件包,步驟繁瑣且配置復雜,不僅涉及操作系統和基礎軟件的安裝,更關鍵的是需要精確配置與GPU硬件緊密關聯的驅動、加速庫、深度學習框架等。這些組件間復雜的版本依賴關系極易導致錯誤,兼容性問題也異常突出,不同GPU型號、操作系統及軟件庫版本間的復雜交互,使得故障排查和調試成本居高不下。因此部署周期長成為一個突出問題,從服務器開通到環境可用往往耗時數小時甚至數天,如果算力規模超過百臺,部署難度和周期會呈指數級上升,嚴重拖慢了AI研發團隊和科研項目進度,降低了GPU資源的利用效率。
其次,為了確保智能算力系統的高性能和穩定運行,需要驗證不同硬件環境下的軟件適配,優化BIOS、操作系統、底層驅動、文件系統和網絡等多項指標,要求專業人員深入了解操作系統、驅動等技術知識,通過大量調試尋求系統性能最優解。若系統環境性能優化不足,例如GPU驅動與框架版本不匹配,將導致GPU的強大算力無法充分釋放,高昂的硬件投資難以獲得預期回報。
最后,由于普遍缺乏自動化部署工具,智能算力系統的環境部署難以標準化和規模化管理,進一步加劇了運維復雜性,難以滿足快速變化的業務需求。
針對系統環境部署難題,積算科技推出GPU裸金屬算力服務套件,為用戶提供智能算力系統環境快速部署、系統性能優化等服務。該套件提供并行環境高效部署工具,包括操作系統、GPU/網絡驅動程序和其他必要的軟件基礎包(如CUDA、InfiniBand/ROCE驅動等)快速安裝、配置和更新。用戶僅需按服務手冊執行少量代碼,即可完成智能算力系統部署,進而高效開展AI模型訓練、微調、推理等任務。此外,該套件還可針對系統、內核、底層驅動進行性能優化。用戶只需執行基于開源框架編寫的簡單腳本命令,幾乎無需修改,即可快速完成性能優化工作,實現顯存效率超過80%、網絡RDMA帶寬效率高于90%,并通過零冗余架構保障高性能負載。借助該套件,用戶最快20分鐘內即可完成200節點系統部署與性能優化,較傳統方法部署(114分鐘)時間縮短約80%,顯著提升部署效率與系統性能。
目前,積算科技裸金屬算力服務套件已經免費開放,可以滿足預訓練、微調、推理、深度學習等應用場景的需求。積算科技裸金屬算力全系列通過硬件直通釋放100%算力,InfiniBand網絡實現納秒級跨卡通信,TB內存保障百億參數流暢加載,NVMe SSD提供百萬級IOPS加速數據吞吐,滿足從單卡推理到千卡算力系統的全維度AI需求。更多產品詳情及試用申請請點擊:算力服務使用(試用)需求表-北京積算科技。
積算科技誕生于全球生成式AI浪潮,專注于智能算力服務市場,致力于成為中國最具價值的智能算力服務商,聚焦互聯網、運營商、高校、新能源汽車等領域的多家頭部客戶提供算力服務。公司擁有萬卡級先進智能算力資源池,提供裸金屬、智能算力系統、專屬智能算力系統等算力服務產品,適用于大模型訓練與推理、算法研究、大數據分析、自動駕駛、智能科學計算等多元場景。其運維和服務團隊具備大規模智能算力系統設計建設、大模型開發應用及性能優化能力,可提供全棧大模型應用開發服務支持,并根據客戶需求提供靈活服務模式。
