【沃資訊】12月7日消息,近期,全球范圍內的科技創新領域迎來一次引人注目的突破。人工智能時代的中國一直是英偉達的重要客戶,但在2023年10月,美國更新了半導體和計算設備的出口管制政策,導致英偉達中國特供版GPU A800和H800自11月17日起將被禁止出口至中國。
據沃資訊了解,面對這一挑戰,英偉達并未束手待斃,而是決定與美國政府進行一場貓鼠游戲,試圖在監管的眼皮底下尋找突破口。為此,英偉達推出了一款新產品——H20,旨在繞過美國新出口管制,繼續在中國市場拓展業務。
H20的浮點運算能力僅有296TFLOPs,性能密度僅為2.9,表面上看是一款超低性能的產品。然而,令人意外的是,即便是這樣低性能的產品,仍然引起了一些公司的購買興趣,并引發了美國監管部門以及英偉達競爭對手的擔憂。
據悉,美國商務部長 Gina Raimondo近期點名英偉達,警告其停止為中國設計繞過出口管控的人工智能芯片。在這場貓鼠游戲中,英偉達的策略是如何運作的呢?
在美國出口管制中,3A090是一個關鍵的ECCN編碼物項,專指高性能集成電路,當芯片的輸入輸出雙向傳輸速率超過每秒600GB或算力超過4800TOPS時,即被歸類為3A090,禁止向中國出口。為了應對此限制,英偉達過去推出了低配版但同架構、同樣配備高帶寬插槽版本的A800和H800,以繞過禁令。然而,這次新規更為嚴格,規定了算力總和和性能密度,導致幾乎絕大多數高算力產品都不再能出口中國。
在這場文字游戲中,性能密度和總算力成為關鍵詞匯。性能密度的定義存在兩種說法,一是人工智能公司通常采用的FLOPs(每秒浮點操作數除以單位面積內的晶體管數量),二是MIPS(每秒百萬指令數除以單位面積內的晶體管數量)。英偉達通過采用H20的HBM3e芯片,利用其體積上的高性能密度,可能是一種繞過規定的手段。
此外,總算力的定義允許一些巧妙的操作。英偉達的H20采用了Hooper架構,擁有多種核心,包括用于張量計算的TensorFloat32核心和腦浮點(BF16)核心。在測試時,可以只計算單精度和雙精度核心,從而在算力總和上呈現較低的性能。
然而,H20的背后可能隱藏著更多秘密。盡管其浮點運算能力看似較低,但其Die尺寸卻達到了814平方毫米,與高性能芯片相當。這使得H20的實際性能可能超過表面上所顯示的數據。英偉達還可能在H20中搭載了TensorRT-LLM功能,通過軟件技術提升GPU性能,以適應實際應用需求。
在這場貓鼠游戲中,英偉達展現了其軟硬件結合的優勢,不僅推出新產品繞過監管,還展示了其在硬件和軟件方面的創新能力。同時,英偉達與SK海力士的合作也為其提供了內存方面的支持,共同開發HBM4以顛覆產業格局。
總體而言,英偉達在中國市場的重要性不僅僅體現在銷售數字上,更體現在與人工智能公司的深度合作以及軟硬件協同創新的裙帶關系中。在這場貓鼠游戲中,貓和老鼠之間存在著一個灰色空間,兩者需要相互協調以維持平衡,從而共同生存。

















