一臺號稱“全球最小超算”的設備引發了科技圈的廣泛關注。這款名為NVIDIA DGX Spark的個人AI超級計算機,搭載了GB10 Grace Blackwell超級芯片,擁有128GB統一內存和2000億參數的處理能力,售價約3萬元人民幣。其目標用戶群體包括科研人員、數據科學家和學生,旨在為他們提供桌面級的高性能AI計算支持。
從CES展會亮相到如今正式推向市場,DGX Spark的定位逐漸清晰。根據網絡評測數據,這款設備在輕量級模型中表現優異,甚至能夠穩定運行1200億參數的大型模型,整體性能介于RTX 5070和RTX 5070 Ti之間。不過,其273 GB/s的內存帶寬成為明顯短板——算力足夠強大,但數據傳輸速度受限,導致實際體驗中“思考快但表達慢”,類似“腦子轉得快卻說話結巴”的情況。
針對這一瓶頸,極客團隊EXO Lab提出了創新解決方案:將DGX Spark與Mac Studio M3 Ultra(帶寬達819 GB/s)協同工作,通過“預填充-解碼分離”(PD分離)技術,將推理速度整體提升2.8倍。具體操作中,DGX Spark負責算力密集的預填充階段,而Mac Studio則承擔帶寬依賴的解碼任務。兩者通過流水線式分層計算,實現計算與數據傳輸的重疊優化。不過,這種組合方案的成本也水漲船高,兩臺DGX Spark加一臺Mac Studio的總價接近10萬元人民幣。
拋開極限性能測試,DGX Spark的日常應用場景更具吸引力。官方提供了超過20種開箱即用的玩法,涵蓋視頻生成、智能體搭建、知識圖譜構建等領域。例如,用戶可通過ComfyUI框架運行阿里Wan 2.2 14B文本到視頻模型,實現本地化視頻生成,無需依賴云端服務。LM Studio等桌面工具也已支持該設備,用戶可輕松部署大型語言模型。
在多智能體交互方面,Level1Techs展示了并行運行四個模型(包括1200億參數的GPT-OSS和67億參數的DeepSeek-Coder)的案例。得益于128GB大內存,設備可同時處理文本生成、代碼編寫、圖像嵌入等任務。NVIDIA官網還提供了詳細操作指南,例如將非結構化文本轉換為知識圖譜,或對視頻進行搜索與摘要總結。
與Mac Mini M4 Pro的對比測試顯示,DGX Spark在預填充階段優勢明顯,但在解碼階段表現平平。例如,在DeepSeek R1開源模型中,Mac Mini的平均TPS(每秒生成詞元數)為17.8,而DGX Spark僅為33.1。這種差異源于內存帶寬的限制——DGX Spark采用的LPDDR5X內存帶寬僅273 GB/s,遠低于高端顯卡GDDR7的1800 GB/s。
盡管存在短板,DGX Spark的生態豐富性和硬件設計仍獲好評。多數用戶反饋設備運行安靜,拆解后可見內部布局工整。對于預算有限但需要本地化AI部署的用戶,這款設備提供了新的選擇;而對于追求極致性能的團隊,其模塊化設計也支持與更高帶寬設備協同工作,拓展應用邊界。





















