AMD近期揭曉了其銳龍AI MAX+ 395 “Strix Halo” APU在DeepSeek R1 AI基準(zhǔn)測(cè)試中的卓越表現(xiàn),這一成績遠(yuǎn)超NVIDIA RTX 5080桌面版顯卡,性能提升幅度超過3倍。
這款A(yù)PU集成了強(qiáng)大的硬件配置,包括基于Zen 5架構(gòu)的16核、32線程處理器,以及擁有50 TOPS算力的XDNA 2神經(jīng)處理單元(NPU)。它還配備了集成顯卡,為用戶提供全面的計(jì)算體驗(yàn)。
值得注意的是,RTX 5080顯卡僅配備16GB的VRAM,這在處理大型語言模型時(shí)顯得力不從心。相比之下,Strix Halo APU提供了高達(dá)128GB的統(tǒng)一內(nèi)存,并可根據(jù)需求靈活分配,最多可將96GB內(nèi)存用作顯存,從而在處理大型AI模型時(shí)展現(xiàn)出顯著優(yōu)勢(shì)。
AMD在基準(zhǔn)測(cè)試中采用了多種消費(fèi)者AI工作負(fù)載,其中包括由llama.cpp驅(qū)動(dòng)的應(yīng)用程序LM Studio。測(cè)試結(jié)果顯示,當(dāng)LLM模型大小超過RTX 5080的16GB VRAM限制時(shí),Ryzen AI MAX+ 395的性能優(yōu)勢(shì)尤為突出,其性能相比RTX 5080提升了3.05倍。
不僅如此,與更高端的RTX 5090(配備32GB顯存)相比,Strix Halo APU在處理大型模型時(shí)依然占據(jù)絕對(duì)優(yōu)勢(shì)。這得益于其龐大的128GB統(tǒng)一內(nèi)存,為用戶提供了更多的靈活性和處理能力。
AMD還強(qiáng)調(diào)了銳龍AI MAX+ 395相對(duì)于其他競品,如Copilot+和英特爾產(chǎn)品的顯著優(yōu)勢(shì)。在性能方面,與英特爾Arc 140V相比,Ryzen AI MAX+ 395在token吞吐量上實(shí)現(xiàn)了最高2.2倍的提升。對(duì)于小型模型如Llama 3.2 3b Instruct,其首個(gè)token生成時(shí)間最快可達(dá)4倍。在處理7-8B參數(shù)模型時(shí),速度提升最高可達(dá)9.1倍。在處理14B參數(shù)模型時(shí),Ryzen AI MAX+ 395的性能比英特爾酷睿Ultra 258V快12.2倍。
在內(nèi)存方面,銳龍AI MAX+ 395提供了高達(dá)128GB的統(tǒng)一內(nèi)存,而競爭對(duì)手的最大內(nèi)存僅為32GB。這一優(yōu)勢(shì)使得Strix Halo APU能夠運(yùn)行其他APU無法處理的大型模型,如谷歌Gemma 3 27B Vision。