近期,互聯(lián)網(wǎng)巨頭字節(jié)跳動旗下的AI助手豆包,悄然展開了一項新功能的內(nèi)部測試,這一消息迅速引起了網(wǎng)友們的廣泛關(guān)注。據(jù)透露,豆包正在探索深度思考模型的應用,盡管此次測試并未采用此前熱議的DeepSeek模型。
3月5日,豆包官方正式宣布推出“深度思考”推理模式,這一模式將全面融入問答、搜索、寫作及閱讀等多個應用場景。用戶只需簡單地在輸入框中啟用“深度思考 Beta”功能,即可體驗這一創(chuàng)新功能。
針對此次測試,豆包方面回應稱,當前正在進行的是自家深度思考模型的多個實驗版本的內(nèi)部評估。有知情人士透露,豆包深度思考模型的研發(fā)是基于其1.5基座模型的進一步升級與優(yōu)化。
回溯至今年1月中旬,豆包大模型團隊在發(fā)布豆包1.5 Pro版本時,就已預告了深度推理模型Doubao-1.5-pro-AS1-Preview的存在。該團隊強調(diào),這一模型在不依賴其他外部模型數(shù)據(jù)的前提下,通過強化學習(RL)算法的突破與工程優(yōu)化,充分利用了測試時縮放(Test Time Scaling)的算力優(yōu)勢,成功實現(xiàn)了RL Scaling,從而研發(fā)出了豆包的深度思考模式。
深度思考模式的推出,意味著用戶將能夠直觀地觀察到AI模型的思考過程。這一過程涉及思維鏈(Chain of Thought,簡稱COT)的展示,即模型通過訓練模擬出類似人類的思考步驟,包括自我質(zhì)疑、反思等中間環(huán)節(jié),盡管這些僅是文字序列,但卻呈現(xiàn)出類似人類的思考邏輯。
在深度思考模式下,用戶不僅能夠獲取AI的最終答案,還能清晰地看到模型解決問題的完整邏輯鏈條。例如,在解答數(shù)學題目時,模型會逐步展示從問題拆解、多種方法驗證到得出最終結(jié)論的全過程,包括自我質(zhì)疑、假設驗證及錯誤修正等關(guān)鍵步驟,為用戶提供了前所未有的透明度和深度理解。