NVIDIA在近期的一次重大技術發(fā)布中,隆重推出了NVIDIA Spectrum-XGS以太網技術,這一創(chuàng)新被視為連接未來AI超級工廠的橋梁。通過其獨特的跨區(qū)域擴展(scale-across)能力,該技術能夠將分布在不同地理位置的數(shù)據中心整合為一個龐大的AI運算體系,其規(guī)模可達十億瓦級別。

NVIDIA Spectrum-XGS以太網不僅繼承了Spectrum-X平臺的橫向擴展架構優(yōu)勢,還實現(xiàn)了跨地域數(shù)據中心的無縫連接。它專為AI時代設計,能夠迅速將巨量數(shù)據集傳輸至AI模型中,并有效協(xié)調各數(shù)據中心間GPU的通信,極大地提升了數(shù)據處理的效率。
在即將召開的年度芯片及系統(tǒng)架構頂級會議Hot Chips上,NVIDIA計劃詳細介紹這一新技術,以及其在推理和加速計算領域的最新進展,包括NVIDIA網絡、數(shù)據中心機架設計、神經渲染技術、GB10超級芯片、DGX Spark項目,以及集成硅光子學的共封裝光學器件(CPO)交換機等。
隨著AI應用的爆發(fā)式增長,傳統(tǒng)數(shù)據中心在單個設施內的功率和容量已接近極限。為了繼續(xù)擴展數(shù)據中心的規(guī)模,必須跨越物理建筑的界限,然而現(xiàn)有的商用以太網基礎設施因延遲高、抖動大以及性能不穩(wěn)定等問題,難以滿足這一需求。NVIDIA Spectrum-XGS以太網正是為了解決這些問題而生,它通過創(chuàng)新的跨區(qū)域擴展技術,打破了現(xiàn)有基礎設施的限制。
NVIDIA的創(chuàng)始人兼CEO黃仁勛表示:“AI工業(yè)革命已經到來,而巨型AI工廠正是這場變革的核心基礎設施。在縱向擴展(scale-up)和橫向擴展(scale-out)之后,我們通過NVIDIA Spectrum-XGS以太網引入了跨區(qū)域擴展(scale-across)技術,使得不同城市、國家甚至大洲的數(shù)據中心能夠組合成一個龐大的AI超級工廠。”
作為AI計算的“第三大支柱”,跨區(qū)域擴展技術完全集成于Spectrum-X平臺,通過先進的算法動態(tài)調整網絡和數(shù)據中心設施間的距離適配。借助自動調節(jié)的遠距離擁塞控制、精確的延遲管理以及端到端遙測技術,NVIDIA Spectrum-XGS以太網將集合通信庫的性能提升了近一倍,顯著加速了多GPU和多節(jié)點的通信,實現(xiàn)了異地AI集群性能的可預測性。
CoreWeave等超大規(guī)模云提供商已經開始部署這一新型基礎設施,其中CoreWeave將成為首批使用NVIDIA Spectrum-XGS以太網連接其數(shù)據中心的企業(yè)之一。NVIDIA Spectrum-X以太網網絡平臺提供的帶寬密度是傳統(tǒng)以太網的1.6倍,由NVIDIA Spectrum-X交換機和ConnectX-8 SuperNIC組成,為構建未來AI平臺的企業(yè)提供了無縫擴展、超低延遲和卓越性能。
此次發(fā)布是NVIDIA一系列網絡創(chuàng)新技術發(fā)布的延續(xù),包括NVIDIA Spectrum-X和NVIDIA Quantum-X CPO網絡交換機等。這些技術共同協(xié)作,能夠將位于不同地點的數(shù)百萬顆GPU整合成強大的AI工廠,突破大規(guī)模AI基礎設施的性能和效率極限,同時降低能耗和運營成本。





















