上個月科技圈的焦點,無疑落在了谷歌身上。憑借性能強勁的Gemini 3,谷歌不僅在半個月內實現股價攀升,更是在AI競技場內外掀起波瀾——對內挑戰OpenAI,對外直指英偉達的市場地位。這一系列動作,讓外界對谷歌自研的TPU(張量處理單元)充滿好奇,甚至有人猜測其是否會顛覆英偉達的CUDA生態。
TPU并非橫空出世的新技術。自2015年啟動以來,這一專為AI設計的芯片已迭代至第七代。其誕生源于谷歌的痛點:傳統GPU在深度學習訓練中效率低下,能耗過高。GPU的通用架構雖能處理圖形渲染、科學計算等多種任務,但在AI矩陣運算中,數據頻繁在顯存與核心間搬運,導致大量能耗浪費在“數據搬運”而非“計算”上。谷歌工程師因此決定砍掉GPU中與AI無關的模塊,專注于優化矩陣乘法,最終開發出“脈動陣列”架構——數據在計算單元間高效傳遞,減少存儲讀寫,顯著提升能效。
初代TPU僅支持推理任務,功能單一,但能效比已達同期英偉達Tesla K80的30倍。隨著技術迭代,第二代TPU通過增加內存容量和傳輸速度,解鎖了訓練能力;第三代則通過規模化部署,進一步縮短模型訓練周期。然而,盡管TPU在成本與性能上具備優勢,其市場滲透卻長期受限——谷歌始終將TPU綁定在自家云服務中,僅提供租賃而非銷售。這種封閉策略讓許多企業望而卻步:將核心算力依賴單一供應商,風險過高。即便如此,蘋果等巨頭仍因成本考量,選擇部分采用TPU。
轉機出現在第七代TPU Ironwood的推出。谷歌首次開放TPU銷售,打破“只租不賣”的傳統。這一決策迅速引發市場反應:meta被曝正與谷歌洽談數十億美元合同,計劃從2027年起在數據中心部署TPU,并可能提前啟動租賃。消息公布后,谷歌股價上漲2.1%,英偉達則下跌1.8%。有內部人士透露,TPU的商業化或使英偉達損失數十億美元收入,占其年營收的10%。資本市場同樣看好這一變化,博通等TPU供應鏈企業股價隨之攀升。
盡管TPU來勢洶洶,但其顛覆GPU的可能性仍存爭議。作為專用集成電路(ASIC),TPU的優化方向高度聚焦于矩陣計算,在AI大模型訓練中表現卓越,但缺乏通用性。若未來AI技術路線轉向非矩陣運算領域,TPU的專用性可能成為劣勢——四年前的TPU v4已因技術迭代而逐漸退出市場。相比之下,GPU憑借CUDA生態的“軟實力”構建了深厚壁壘:開發者代碼、庫優化甚至錯誤調試均圍繞CUDA展開,遷移至TPU需重構代碼、適應新環境,甚至掌握特定語言如JAX,這對中小型企業而言成本過高。即便谷歌自身,其云服務仍依賴大量英偉達GPU以滿足客戶多樣化需求。
當前,TPU與GPU的競爭更可能形成“專用與通用”的分野:TPU占據頭部企業的定制化需求,GPU繼續主導通用市場。這種競爭格局或推動算力成本下降,最終惠及整個行業。無論結果如何,科技巨頭在算力領域的博弈,已為AI發展的下一階段埋下伏筆。






















