在人工智能技術加速迭代的浪潮中,全球產業格局正經歷深刻重構。云天勵飛董事長陳寧在近期舉辦的行業論壇上指出,隨著AI應用進入爆發臨界點,推理算力需求呈現指數級增長,而中國芯片產業有望在這一輪變革中實現關鍵突破。他特別強調,推理芯片賽道為中國科技企業提供了與全球巨頭同臺競技的獨特機遇。
陳寧將人工智能發展劃分為三個階段:2012-2020年的智能感知時代以垂直場景解決方案為主,2020-2025年的AIGC時代催生大模型技術突破,而2025年開啟的智能體時代將徹底改變產業形態。他以豆包手機、AI眼鏡等終端設備為例,指出這些產品通過深度融合大模型與硬件載體,正在創造全新的應用生態。這種變革直接導致算力需求結構發生根本性轉變——從訓練主導轉向推理主導。
"訓練階段追求極致性能,而推理階段必須回歸商業本質。"陳寧通過歷史類比揭示產業規律:正如愛迪生通過電網建設將電力革命推向大眾市場,推理芯片的普及需要解決性價比難題。他特別指出,谷歌最新TPU戰略轉向"訓推分離",博通為meta、OpenAI定制專用推理芯片,這些動向印證了獨立推理賽道的崛起趨勢。
面對全球算力競賽的新格局,陳寧認為中國在訓練芯片領域面臨先進制程限制和生態壁壘雙重挑戰,但在推理賽道具備獨特優勢。他透露,云天勵飛自主研發的GPNPU架構通過三大創新突破傳統瓶頸:其一,兼容CUDA生態的SIMT編程范式確保開發靈活性;其二,優化矩陣計算硬件提升單位面積算力;其三,采用先進封裝技術突破內存帶寬限制。這種設計使芯片在計算性能、存儲容量和功耗控制間實現最優平衡。
行業數據印證著推理市場的爆發潛力。以豆包大模型為例,其日均處理50萬億token的規模已對基礎設施提出嚴苛要求。據測算,若處理量突破100萬億且能效未顯著改善,電力消耗將呈現千倍級增長。陳寧提出明確目標:通過架構革新和工藝創新,將百萬token推理成本壓縮至分級別,這需要存算一體等顛覆性技術的突破。
頭部企業的布局動態進一步凸顯市場熱度。有消息稱,某科技巨頭2026年AI基建預算達1600億元,其中推理基礎設施投入占比顯著提升。陳寧分析指出,當模型參數規模突破萬億級,傳統架構的內存墻問題將愈發突出,這為中國芯片企業提供了換道超車的戰略機遇期。他特別強調,推理芯片的競爭本質是系統工程能力的比拼,而這正是中國制造業的強項所在。




















