一臺被稱為“全球最小超算”的設備NVIDIA DGX Spark,正引發科技圈的廣泛關注。這款面向科研人員、數據科學家和學生的個人AI超級計算機,憑借其128GB內存和2000億參數處理能力,試圖在桌面端實現高性能AI計算。然而,其3萬元的售價與實際性能表現,成為討論焦點。
根據多方評測,DGX Spark在輕量級模型中表現優異,甚至能穩定運行1200億參數的大模型,整體性能介于RTX 5070與RTX 5070 Ti之間。但其核心短板在于273GB/s的內存帶寬限制——這一數據傳輸速度遠低于高端顯卡的1800GB/s,導致解碼階段(生成答案)效率低下。有用戶形容其體驗為“腦子轉得快但說話結巴”,首字響應迅速但后續輸出卡頓。
為突破帶寬瓶頸,極客團隊EXO Lab嘗試將DGX Spark與Mac Studio M3 Ultra(帶寬819GB/s)聯動,通過“預填充-解碼分離”技術,將推理速度提升2.8倍。然而,這種方案需同時使用兩臺DGX Spark和一臺Mac Studio,總成本接近10萬元,性價比爭議隨之而來。有評論指出:“用十萬設備跑本地模型,未免過于奢侈。”
盡管存在缺陷,DGX Spark的128GB統一內存仍為其拓展了應用場景。官方提供超過20種開箱即用的玩法,涵蓋視頻生成、多智能體助手搭建等。例如,用戶可利用ComfyUI框架運行阿里Wan 2.2視頻模型,或通過LM Studio部署本地大模型。實測中,設備在視頻生成時溫度達60-70攝氏度仍保持靜音,內部結構設計獲博主稱贊“工整有序”。
在對比測試中,DGX Spark的Prefill階段(閱讀理解)優勢明顯,但Decode階段(生成答案)表現平平。以DeepSeek R1模型為例,其平均TPS(每秒生成詞元數)為33.1,僅略高于Mac Mini M4 Pro的17.8。評測團隊指出,批次大小對性能影響顯著:當批次設為32時,DGX Spark的解碼速度可飆升至370詞元/秒,但對普通用戶而言,如此高負載場景并不常見。





















