智譜近日宣布開源其自主研發(fā)的AI Agent核心模型AutoGLM,這一舉措被業(yè)界視為推動智能設(shè)備交互方式變革的重要里程碑。該模型首次實現(xiàn)了“Phone Use”能力,即通過屏幕理解與模擬人類操作,自主完成外賣下單、機票預訂等需要多步驟交互的復雜任務(wù),其操作流暢度與穩(wěn)定性已通過實際場景驗證。
此次開源計劃為硬件開發(fā)者與系統(tǒng)集成商提供了完整的技術(shù)解決方案。基于AutoGLM,開發(fā)者可在安卓設(shè)備上快速構(gòu)建具備屏幕感知能力的AI助手,實現(xiàn)點擊、滑動、輸入等擬人化操作。目前,該模型已覆蓋微信、淘寶、抖音等50余款主流中文應用的核心功能,其自動化流程設(shè)計與此前引發(fā)熱議的“豆包手機”演示效果高度相似,但開源特性使其具備更廣泛的適配潛力。
技術(shù)架構(gòu)層面,智譜開放了多層組件:包括預訓練的核心模型、Phone Use能力框架、配套工具鏈,以及可直接運行的Demo工程。針對安卓系統(tǒng),項目提供了適配層代碼與開發(fā)示例,確保技術(shù)方案能快速落地。所有代碼采用Apache-2.0協(xié)議開源,模型部分則遵循MIT協(xié)議,開發(fā)者可自由修改或拆分使用組件,甚至基于現(xiàn)有框架進行深度定制。
隱私保護是本次開源項目的核心優(yōu)勢之一。智譜強調(diào),AutoGLM支持本地化部署與云端協(xié)同兩種模式,用戶可自主選擇數(shù)據(jù)存儲位置,確保操作記錄與個人信息始終處于可控范圍。這種設(shè)計既滿足了企業(yè)級用戶對安全性的要求,也為個人開發(fā)者提供了靈活的技術(shù)實驗環(huán)境。
開源資源包中包含詳盡的技術(shù)文檔與快速入門指南,幫助開發(fā)者快速掌握模型調(diào)用方法。GitHub倉庫(github.com/zai-org/Open-AutoGLM)已上線完整代碼庫,涵蓋模型訓練腳本、應用適配接口及多場景測試用例。開發(fā)者可基于現(xiàn)有框架開發(fā)垂直領(lǐng)域應用,例如醫(yī)療掛號助手、銀行事務(wù)自動化等,進一步拓展AI手機的生態(tài)邊界。
行業(yè)分析師指出,AutoGLM的開源將顯著降低AI手機的技術(shù)開發(fā)門檻,加速智能設(shè)備從“功能疊加”向“原生交互”的演進。通過開放核心能力,智譜正在構(gòu)建一個由開發(fā)者共同參與的技術(shù)生態(tài),這種模式或?qū)⒊蔀槲磥碇悄芙K端競爭的關(guān)鍵變量。





















