在人工智能領域,國產大模型正以驚人的速度崛起。近日,智譜推出的GLM-4.7模型引發廣泛關注,這款在IPO前夕亮相的模型,憑借多項技術突破,成為全球開源模型中的佼佼者。
從專業測評數據來看,GLM-4.7在多個維度展現出強勁實力。在Code Arena面向全球開發者的編碼盲測中,該模型在Web開發方向排名第六,超越GPT-5.2與Claude Sonnet 4.5,成為全球排名最高的開源模型,同時穩居國產模型榜首。在代碼能力方面,SWE-bench?Verified測試中取得73.8%的成績,LiveCodeBench?V6測試中達到84.9%,整體水平與Claude Sonnet 4.5持平,處于開源模型第一梯隊。復雜推理任務中,HLE成績在工具輔助條件下提升至42.8%,較GLM?4.6提升超12個百分點,甚至超過GPT?5.1 High。工具調用能力同樣出色,在τ2?Bench中取得87.4%的成績,BrowseComp在開啟上下文管理后提升至67.5%,在多輪網頁任務和交互式工具調用場景中表現穩定。
這些亮眼成績的背后,是模型內部思考機制的重大調整。GLM?4.7在“交錯思考”基礎上,引入保留式思考與輪級思考控制機制。模型在每次生成和工具調用前會先進行推理,并在多輪任務中自動保留已有思考結果,避免重復推導。開發者還可按輪次決定是否啟用推理過程,在簡單請求中降低時延,在復雜任務中提升穩定性。這種設計增強了長任務執行的一致性和可控性,為模型在代碼智能體、終端任務和工具協同類基準上的整體提升提供了支撐。模型還針對前端美學、長文本穩定性、網頁生成結構等細節進行了優化。
為了驗證GLM?4.7在實際開發任務中的表現,智譜對100個真實編程任務進行了對比測試,涵蓋前端開發、后端邏輯和指令遵循三個核心方向。結果顯示,前端任務中,GLM?4.7相較4.6版本勝率提升至64.6%;指令遵循場景中達到58.3%;后端方向勝率穩定在46.7%。在多技能聯動能力方面,GLM-4.7在Z.ai上線了全棧技能環境,接入全新Skills模塊,支持調用ASR語音識別、TTS語音合成、GLM?4.6V視覺模型等多個模塊進行統一調度,實現了多模態任務中的路徑規劃和動作執行,打通了工具之間的“調度邏輯”。
在實際互動任務測試中,GLM-4.7的表現同樣令人驚艷。在3D控制任務中,模型輸出可直接運行的HTML代碼,構建出包含5000多個粒子的立體圣誕樹,頂部帶有輝光效果的星星。移動鼠標時,粒子會產生斥力波紋,形成流動的視覺效果。系統還能調用攝像頭識別用戶手勢,張開手掌時圣誕樹炸開變為照片墻,左右移動手掌照片墻會旋轉,握拳時所有元素收攏歸位,形成完整動畫。代碼中還集成了性能優化機制,確保頁面在不依賴構建工具的情況下保持高幀率和流暢度。在UI生成任務中,輸入“1:1復刻iOS系統”提示詞后,模型生成了模仿iOS的主頁面,Safari、Siri等圖標均可點擊,日歷、天氣等功能頁可交互,計算器能進行基礎運算,圖標風格和顏色搭配也具備基本審美。在前端代碼實現任務中,模型生成了完整的雙人格斗游戲界面,風格高度還原Switch主機Joy-Con手柄配色和布局,左側藍色手柄,右側紅色手柄,中間是游戲主屏幕。游戲中有兩個火柴人角色,頭頂有動態血條,UI顯示當前波次與敵人數量等信息,操作體驗上,左右玩家可通過鍵盤不同按鍵控制角色移動、攻擊和釋放技能,整體界面結構、角色邏輯和按鍵響應完整,具備真實游戲框架感,且內置節奏感強的格斗BGM。
GLM-4.7的開源代碼在全球社區中已被下載超6000萬次,付費API使用量長期居于OpenRouter全球前十,逐步進入開發者的實際工具列表。在智譜即將登陸港交所的背景下,GLM-4.7的上線成為國產大模型企業從科研模型、開源生態向“真實使用”與“市場驗證”過渡的一個縮影,標志著開源國產模型正從“對標國際”邁向“領跑、實用”。


















