在近日舉辦的GOSIM2025大會上,清華大學聯(lián)合中國軟件評測中心共同推出了一份聚焦大模型服務性能的權威榜單——《2025大模型服務性能排行榜》。其中,派歐云計算(上海)有限公司(簡稱“PPIO”)憑借在DeepSeek-R1-0528模型吞吐測試中的卓越表現,榮登榜首。
該榜單通過深度剖析延遲、吞吐、可靠性等核心指標,依托專業(yè)團隊開展的長周期、高頻次、多時段數據評測,全面展現了不同MaaS(Model as a Service)供應商的服務質量。評測過程中,平臺以匿名用戶身份對各MaaS平臺進行端到端性能測試,確保了評測結果的客觀性與公正性。
此次評測覆蓋了DeepSeek-R1-0528、DeepSeek-V3.1、Kimi-K2-Instruct等多個具有代表性的大模型。在參與評測的20余家MaaS供應商中,PPIO的表現尤為搶眼。
具體來看,在DeepSeek-R1-0528模型的吞吐測試中,PPIO以每秒45.17個Token的處理能力拔得頭籌。同時,在DeepSeek-V3.1、Kimi-K2-Instruct等模型的測試中,PPIO在吞吐和延遲性能方面也均躋身前五。
吞吐和延遲是衡量模型性能的兩個關鍵指標。吞吐能力反映了平臺在單位時間內能夠處理的Token數量,高吞吐意味著平臺能夠支持更多用戶同時使用,尤其適用于大規(guī)模應用場景。而延遲則衡量了用戶從輸入到獲得首個回復所需的時間,低延遲意味著更快的響應速度,對用戶體驗至關重要。
PPIO在這兩個維度上的出色表現,不僅證明了其能夠提供流暢的實時交互體驗,還能在高并發(fā)和大規(guī)模任務處理中保持穩(wěn)定。這背后,是PPIO在算力調度、模型部署、系統(tǒng)優(yōu)化等推理優(yōu)化核心技術上的深厚積累。
作為國內領先的獨立分布式云計算服務商,PPIO始終致力于優(yōu)化AI基礎設施。其目標是為人工智能、智能體、實時音視頻處理、具身智能等新一代應用場景,提供高性價比、超彈性、低延遲的一站式智算、模型及邊緣計算服務。