在拉斯維加斯舉行的AWS re:Invent 2025年度技術大會上,亞馬遜云科技(AWS)正式發(fā)布了其最新一代AI訓練芯片Trainium3,并首次披露了下一代產品Trainium4的研發(fā)進展。這一系列動作標志著AWS在自研芯片領域的持續(xù)深耕,也展現(xiàn)了其在全球AI算力競爭中的雄心。
基于3納米制程工藝打造的Trainium3芯片,是AWS第三代AI訓練芯片。其配套系統(tǒng)Trainium3 UltraServer在性能上實現(xiàn)了顯著突破:訓練和高負載推理場景下的速度較前代提升超過4倍,內存容量增至4倍。更引人注目的是,通過超高速互聯(lián)技術,數(shù)千臺UltraServer可構建起搭載最多100萬顆Trainium3芯片的超大規(guī)模集群,規(guī)模達到上一代系統(tǒng)的10倍。每臺UltraServer最多可集成144顆芯片,為大規(guī)模AI模型訓練提供了前所未有的算力支持。
在能效方面,新一代系統(tǒng)較前代提升了40%。這一改進在當前全球數(shù)據(jù)中心耗電量持續(xù)攀升的背景下顯得尤為重要。AWS表示,通過優(yōu)化芯片架構和系統(tǒng)設計,Trainium3在提供強大算力的同時,顯著降低了單位算力的能耗,有助于構建更可持續(xù)的AI基礎設施。
商業(yè)應用層面,Trainium3已獲得多家客戶的青睞。包括Anthropic(AWS投資企業(yè))、日本大語言模型公司Karakuri、音樂創(chuàng)作平臺SplashMusic以及AI研發(fā)公司Decart在內的客戶,已率先采用該系統(tǒng)并實現(xiàn)了推理成本的顯著降低。這些案例驗證了Trainium3在實際場景中的性能優(yōu)勢和成本效益。
關于下一代產品Trainium4,AWS透露其正在研發(fā)中,并承諾將帶來又一次性能飛躍。最引人注目的是,Trainium4將支持英偉達的NVLink Fusion高速芯片互連技術。這一技術允許Trainium4芯片與英偉達GPU協(xié)同工作,擴展整體性能,同時繼續(xù)利用亞馬遜自研的低成本服務器機架技術。通過兼容NVLink Fusion,Trainium4有望降低遷移門檻,吸引更多原本為英偉達GPU優(yōu)化的大型AI應用轉向亞馬遜云平臺。
當前,英偉達的CUDA平臺已成為AI應用的主流標準。AWS通過支持NVLink Fusion,不僅增強了Trainium4的兼容性,也為其在AI市場爭取更大份額提供了技術支撐。盡管AWS尚未公布Trainium4的具體發(fā)布時間表,但參照以往產品發(fā)布節(jié)奏,外界普遍預期將在2026年的re:Invent大會上獲得更多詳細信息。
從Trainium3到Trainium4,AWS的自研芯片戰(zhàn)略正逐步顯現(xiàn)成效。通過持續(xù)的技術創(chuàng)新和生態(tài)構建,AWS不僅強化了自身在AI算力領域的競爭力,也為全球AI開發(fā)者提供了更多選擇。隨著Trainium4的研發(fā)推進,AWS與英偉達在AI硬件領域的競爭與合作格局或將迎來新的變化。




















